Implementação e Validação de Novos Módulos em um Sistema Anti-Spam.

Abstract

O correio eletrônico é uma das principais formas de comunicação. O maior problema encontrado atualmente em sua utilização é o crescente número de mensagens indesejadas (spams) recebidas diariamente pelos usuários. O grande volume de spams causa prejuízos, tais como, desperdícios de tempo, de espaço de armazenamento, da largura da banda de rede, bem como comprometimento no recebimento de mensagens, atrasos, disseminação de vírus, spybots, dentre outros. É importante que sejam desenvolvidas ferramentas e técnicas de combate a esta prática com intuito de mitigar estes problemas. O desafio do problema em questão reside no fato de que os sistemas (ou filtros) antispam evoluem através de técnicas de detecção e bloqueio eficazes e, em contrapartida, os spammers criam e desenvolvem novas técnicas de ofuscamento para burlar tais sistemas. Esta dissertação aborda a implementação e validação de novos módulos em um sistema anti-spam (SAS) que emprega técnicas de análise de conteúdo e redes neurais. O sistema é composto por um novo pré-filtro, que faz uso de métodos, desenvolvidos neste trabalho, para combate ao ofuscamento de conteúdo, por um módulo de seleção de características, que analisa o conteúdo da mensagem buscando palavras relevantes para redução da complexidade da classificação e, por fim, por um novo modelo neural MLP (Multilayer Perceptron), implementado em Java e treinado com backpropagation, para classificar os e-mails em duas classes ̶ ham e spam. Os testes foram realizados no ambiente real da Universidade Federal de Itajubá e comparados com o desempenho de um filtro anti-spam de uso comercial (Barracuda) utilizado na Universidade. Foram empregadas três técnicas de seleção de características, com diferentes combinações de características. Os resultados obtidos são promissores

    Similar works