Análise inteligente de importação de bases de dados de contactos

Abstract

Plataformas de marketing cujo modelo de negócio assenta em soluções de marketing digital para outras organizações tendem a lidar com diversos canais de comunicação, sendo que o e-mail é, por norma, um dos principais. É natural que, para conseguirem entregar e-mails pelos seus utilizadores, estas plataformas utilizem endereços e domínios próprios. No entanto, isto pode levar a grandes quedas em entregabilidade se fornecedores de serviços de internet colocarem esses endereços/domínios em black lists. A razão pela qual esta possibilidade pode ocorrer está relacionada com o facto da plataforma poder vir a ser utilizada inapropriadamente por spammers para criar campanhas de spam. Assim sendo, existe a necessidade destas empresas tentarem ao máximo que spam não ocorra através dos seus sistemas de modo a não prejudicar o seu modelo de negócio. Esta tese propõe a criação de um sistema de prevenção de spam baseado na análise preventiva de bases de dados de contactos importadas utilizando uma abordagem de machinelearning. De modo a implementar o sistema proposto diversos passos foram desenvolvidos. Primeiramente o problema foi definido e a pesquisa do estado de arte foi realizada. Posteriormente, foi feita uma análise relativa ao valor que a solução traria para a empresa. Tendo o valor criado pela solução sido estabelecido, foi definido o design da solução proposta tendo-se realizado levantamento de requisitos, exposto alternativas de design e definido casos de uso esperados no sistema final. Passou-se, depois, para a fase de desenvolvimento, onde foi realizado o levantamento de features importantes para a classificação de spam, as quais foram posteriormente utilizadas para treinar diferentes protótipos de classificadores. Sendo que as capacidades destes diversos classificadores foram, depois dos mesmos serem afinados perante as especificações do problema, disponibilizadas através de uma API simples e bem documentada. Finalmente, foi realizado um estudo computacional de modo a analisar o desempenho dos vários protótipos criados para a solução de classificação desenvolvida.Marketing platforms, whose main business model is to provide digital marketing solutions to marketers, usually deal with multiple communication channels, e-mail being one of the main ones. It is only natural, that they need certain domain and e-mail addresses in order to accomplish their task of delivering their users e-mails. However, a problema arises if internet service providers black list the organization’s domains or addresses, as the solution’s deliverability rate greatly decrease. The reason why this happens is due to the improper use of the platform’s capabilities by spammers. It, therefore, becomes a necessity for these organizations to try and block spam from occurring on their system, so as to prevent damaging their business model. This thesis proposes the creation of a spam prevention system based on judgment of user’s contact databases while using a machine learning approach. The present work is divided in various steps, which include: a state of the art research, a value analysis, the design of the solution, that solution’s development and performed tests/evaluation. Through this work an understandable solution to the presented problem was created based on machine-learning technologies. This solution was thoroughly tested and then made available to external usage through a simple and well documented Application Program Interface (API)

    Similar works