3 research outputs found
Identificação e caracterização de campanhas de spam a partir de honeypots
Exportado OPUSMade available in DSpace on 2019-08-14T06:04:44Z (GMT). No. of bitstreams: 1
ciencomputacao_pedrohenriquecalaisguerra_dissertacao.pdf: 4783560 bytes, checksum: 0f275c26c4afd618cfee6be3d83cf2cc (MD5)
Previous issue date: 9Este trabalho apresenta uma metodologia para caracterização de estratégias de disseminação de spams a partir da identificação de campanhas. Para entender com profundidade como spammers abusam os recursos da rede e constróem suas mensagens, uma análise agregada das mensagens de spam não é suficiente. O agrupamento de mensagens de spam em suas respectivas campanhas permite revelar comportamentos que não poderiam ser percebidos ao considerar o conjunto de mensagens como um todo. Este trabalho propõe uma técnica para identificação de campanhas de spam baseada na construção de uma Árvore de Padrões Frequentes, capaz de capturar os invariantes no conteúdo das mensagens e detectar mensagens que diferem apenas por características ofuscadas e variadas aleatoriamente por spammers. A técnica foi capaz de agrupar um conjunto de 350 milhões de mensagens em 57.851 campanhasdistintas. Em seguida, essas campanhas foram caracterizadas em termos de seus conteúdos e da forma como exploram recursos da rede. A partir da aplicação de algoritmos de mineração de regras de associação, foi possível determinar co-ocorrência de atributos das campanhas que revelam diferentes estratégias de disseminação de spams. Em particular, foram determinadas relações significativas entre a origem do spam e a forma como ele é disseminado na rede,entre sistemas operacionais e tipos de abuso e na forma como spammers encadeiam abusos entre máquinas na rede para entregar mensagens enquanto mantém anonimato. Os dados utilizados no trabalho foram coletados a partir de honeypots de baixa-interatividade que emulam proxies e relays abertos, comumente abusados por spammers. A coleta dos dados por esses emuladores estabeleceu uma visão do tráfego de spams antes que as mensagens fossem entregues aos destinatários, o que permitiu a determinação das diferentes estratégias de entrega de mensagens empregadas por spammers.This work presents a methodology for the characterization of spamming strategies based on the identification of spam campaigns. To deeply understand how spammers abuse network resources and obfuscate their messages, an aggregated analysis of spam messages is not enough. Grouping spam messages into campaigns is important to unveil behaviors that cannot be noticed when looking at the whole set of spams collected. We propose a spam identification technique based on a frequent pattern tree, which naturally captures the invariants on message content and detect messages that differ only due to obfuscated fragments. The technique was able to group 350 million messages into 57,851 distinct campaigns. After that, we characterize these campaigns both in terms of content obfuscation and exploitation of networkresources. Our methodology includes the use of attribute association analysis: by applying an association rule mining algorithm, we were able to determine co-occurrence of campaign attributes that unveil different spamming strategies. In particular, we found strong relationsbetween the origin of the spam and how the network was abused, between operating systems and types of abuse and patterns that describe how spammers chain machines over the Internetto conceal their identities. Data was collected from low-interaction honeypots emulating open proxies and open relays, traditionally abused by spammers. The data collected from these emulators created a vantage point of spams from inside the network, before the messages were delivered to recipients, and that allowed the determination of the different strategies adopted by spammers to deliver their messages
Sentiment analysis on multipolarized social networks
Exportado OPUSMade available in DSpace on 2019-08-13T00:03:54Z (GMT). No. of bitstreams: 1
pedrohenriquecalais.pdf: 3352237 bytes, checksum: 372181ed5be9275a4f95777814152964 (MD5)
Previous issue date: 24Uma significativa fração de debates em mídias sociais está concentrado em temas que induzem polarização na sociedade que é o processo pelo qual um grupo social se divide em dos sub-grupos com visões opostas sobre um tema. Observamos debates polarizados em uma grande gama de temas amplos e relevantes para a sociedade, como Política, esportes e políticas públicas. Nesta tese de doutorado, desenvolvemos contribuições em três direções: 1. Primeiramente, medimos a intensidade da polarização em redes sociais online que debatem um tema específico. Em particular demonstramos que a métrica de ciência de rede mais coumumente empregada para este tipo de análise (modularidade) não é adequada para discriminar polarização da ausência de polarização; ebtão propomos e avaliamos duas métricas adicionais baseadas na estrutura da rede que, como demonstraremos, capturam mais precisamente o fenômenos social de polarização. 2. Oferecemos novos métodos para processar e interpretar opiniões expressadas em discussões polarizadas online a partir do emprego de teorias bem-estabelecidas na literatura de psicologia social que descrevem como as pessoas formam as suas opiniões. Usamos estas teorias como fundações para novas sinais que habilitam métodos de análise de sentimento em cenários em que as opiniões chegam na forma de fluxos sociais um fluxo de opiniões evolutivo e dinâmico. 3. A terceira contribuição está relacionada ao fato de que, em muitos domínios, mais do que dois lados estão em conflito em relação a um tópico, como em sistemas políticos multipartidários. Diferentemente do caso clássico de bipolarização, em redes sociais multipolarizadas observamos relações mais complexas, além da dualidade concordância e antagonismo. Além de demonstrar as inconsistências que não são percebidas em análises de redes sociais bipolarizadas, propomos um algoritmo que infere relações de antagonismo entre comunidades neste cenário.We witness polarized debate in a wide range of relevant topics for the society, such as Politics, Sports and Public Issues. In fact, a significant fraction of debate in social media is concentrated on issues that induce polarization in the society. In this dissertation, we develop contributions on three main directions that analyze and make sense of 'online battles'' fought on social media networks over polarizing topics: We start by (1) measuring the strength of polarization on (online) social networks with respect to a given topic discussion, then, in the context of polarized topics, we (2) offer new methods for processing and interpreting opinions expressed on online polarized debate by uncovering from the social psychology literature well-established social theories that describe how people form their opinions on polarized discussions, and finally we (3) study multipolarized social networks, when more than two viewpoints are in conflict with respect to a topic