In this work, we present the development of an Open Source Anti-Spam System
(SASCA) in Java. Unlike commercial anti-spam systems, SASCA does not make
use of block lists (black / white), but rather of m machine learning models for
email classification.
Several experiments were carried out on a basis of real e-mails collected at the
Federal University of Itajubá.
In the experiments carried out, it was observed that the SASCA performed very
close to the CanIt commercial anti-spam system in terms of e-mail classification,
but with a much better performance in terms of the time required for classification.Neste trabalho, apresentamos o desenvolvimento de um Sistema Anti-Spam de
Código Aberto (SASCA), em Java. Ao contrário de sistemas anti-spam comerciais,
o SASCA não faz uso de listas de bloqueio (negras/brancas) e sim de modelos de
machine learning para classificação de e-mails.
Foram realizados diversos experimentos sobre uma base de e-mails reais, coletados
na Universidade Federal de Itajubá Nos experimentos realizados, observou-se que o SASCA obteve desempenho bem próximo ao do sistema anti-spam comercial CanIt, em termos de classificação de
e-mails, mas com desempenho bem melhor, em termos de tempo requerido para
classificação