10 research outputs found

    Avaliação de Métodos de Mineração de Textos Aplicados à Detecção de Fake News Eleitorais Brasileiras

    Get PDF
    The evolution of the media has contributed to the spread of false news, especially after the emergence of digital social networks. The speed with which this news spread made it impossible to manually check this huge amount of data. In this context, work in several areas has been carried out in order to try to minimize the damage caused by the proliferation of socalled fake news. The objective of this work is to evaluate the effectiveness of the most used methods to check correspondence of texts, in the context of detecting false news, based on the Brazilian presidential elections of 2018, as well as making a comparison with the results of the US election. 2016, published in the literature. Additionally, an overview of the fake news by followers of each candidate is presented. A controlled experiment was planned and executed to compare the effectiveness of the selected methods. The TF-IDF and BM25 methods stood out in this context, having, statistically and respectively, similar averages of Accuracy (79,86% and 79,00%), Precision (79,97% and 78,76%), Sensitivity (78,97% and 76,05%) and Measure-F1 (79,47% and 77,38%). The effectiveness was similar to that of the North American context, in which the BM25 achieved an Accuracy of 79,99%. Furthermore, considering the universe of checked news available, the analyzed period and a margin of error of 3,5%, it was evident that fake news were disclosed by both sides and that followers of the candidate Jair Bolsonaro (PSL) were responsible for 62,25% of tweets related to fake news, against 37,75% of followers of candidate Fernando Haddad (PT). With regard to accounts deleted from the social network in a short time, 59,96% were followers of the PSL candidate and 40,04% of followers of the PT candidate. The dissemination of fake news does not always imply intention, and may only imply greater engagement by some followers.Contexto: A evolução dos meios de comunicação tem contribuído com a disseminação de notícias falsas, principalmente após o surgimento das redes sociais digitais. A velocidade com que estas notícias se espalham tornaram inviável a checagem manual desse imenso volume de dados. Diante deste contexto, trabalhos em diversas áreas têm sido realizados a fim de tentar minimizar os danos causados pela proliferação das denominadas fake news. Objetivo: O objetivo deste trabalho é avaliar a eficácia dos métodos mais utilizados para verificar correspondência de textos, no contexto da detecção de notícias falsas, tendo como base as eleições presidenciais brasileiras de 2018, bem como fazendo um comparativo com os resultados da eleição norte-americana de 2016, publicados na literatura. Adicionalmente, uma visão geral das fakes por seguidores de cada candidato é apresentada. Método: Foi planejado e executado um experimento controlado, para comparar a eficácia dos métodos selecionados. Resultados: Os métodos TF-IDF e BM25 se destacaram nesse contexto, possuindo, estatisticamente e respectivamente, médias similares de Acurácia (79,86% e 79,00%), Precisão (79,97% e 78,76%), Sensibilidade (78,97% e 76,05%) e Medida-F1 (79,47% e 77,38%). Conclusão: A eficácia foi similar à do contexto norte-americano, no qual o BM25 alcançou uma Acurácia de 79,99%. Além disso, considerando o universo de notícias checadas disponível, o período analisado e uma margem de erro de 3,5%, evidenciou-se que houve divulgação de fakes por ambos os lados e que seguidores do candidato Jair Bolsonaro (PSL) foram responsáveis por 62,25% dos tweets relacionados a notícias falsas, contra 37,75% dos seguidores do candidato Fernando Haddad (PT). No que diz respeito às contas excluídas da rede social em um curto espaço de tempo, 59,96% eram de seguidores do candidato do PSL e 40,04% de seguidores do candidato do PT. A divulgação de fake news nem sempre implica intenção, podendo implicar apenas um engajamento maior por parte de alguns seguidores

    Uma abordagem para aumento de empatia das interações textuais em sistemas colaborativos

    Get PDF
    Empathy plays an essential role in social interactions, for example, in effective teaching-learning processes in teacher-student relationships, and in the company-client or employee-customer relationships, retaining potential partners and providing them with greater satisfaction. In parallel, Computer-Mediated Communication (CMC) support people in their interactions, especially when it is necessary to circumvent space-time limitations. In CMC, there are several approaches to promote empathy in social or human-computer interactions. However, for this type of communication, a little explored mechanism to gain empathy is the use of the theory of Neurolinguistics that presents the possibility of developing a Preferred Representation System (PRS) for cognition in humans. In this context, this work presents the conception and results obtained through the experimental evaluations of the NeuroMessenger library, that uses Neurolinguistics, Psychometry and Text Mining to promote empathy among interlocutors, from the PRS identification and suggestion of textual matching based on this classification. The results showed that the use of the same text pattern (PRS) increases the empathy among the interlocutors of Collaborative Systems, evidencing that the matching feature can significantly improve the communication and construction of rapport in virtual environments.A empatia desempenha um papel essencial em interações sociais, como, por exemplo, em processos de ensino-aprendizagem efetivos nas relações professor-aluno e, nas relações empresa-cliente ou colaborador-consumidor, retendo potenciais parceiros e proporcionando-lhes maior satisfação. Em paralelo, a Comunicação Mediada por Computador (CMC) auxilia as pessoas em suas interações, especialmente quando é necessário contornar as limitações de espaço-tempo. Em CMC, existem diversas abordagens para promover empatia em interações sociais ou humano-computador. Contudo, para esse tipo de comunicação, um mecanismo pouco explorado para ganho de empatia é o uso da teoria da Neurolinguística, a qual apresenta a possibilidade de desenvolvimento de Sistemas Representacionais Preferenciais (SRPs) para cognição em seres humanos. Nesse contexto, o presente trabalho apresenta a concepção e os resultados obtidos por meio de avaliações experimentais da biblioteca NeuroMessenger, a qual utiliza Neurolinguística, Psicometria e Mineração de Textos para promover empatia entre interlocutores, a partir da identificação de SRPs e sugestão de matching (espelhamento) textual baseado nesta classificação. Os resultados mostraram que a utilização do mesmo padrão de texto (SRP) aumenta a empatia entre os interlocutores de Sistemas Colaborativos, evidenciando que o recurso de matching pode melhorar significativamente a comunicação e formação de rapport em ambientes virtuais.São Cristóvão, S

    Experimental Analysis of Stemming on Jurisprudential Documents Retrieval

    No full text
    Stemming algorithms are commonly used during textual preprocessing phase in order to reduce data dimensionality. However, this reduction presents different efficacy levels depending on the domain that it is applied to. Thus, for instance, there are reports in the literature that show the effect of stemming when applied to dictionaries or textual bases of news. On the other hand, we have not found any studies analyzing the impact of radicalization on Brazilian judicial jurisprudence, composed of decisions handed down by the judiciary, a fundamental instrument for law professionals to play their role. Thus, this work presents two complete experiments, showing the results obtained through the analysis and evaluation of the stemmers applied on real jurisprudential documents, originating from the Court of Justice of the State of Sergipe. In the first experiment, the results showed that, among the analyzed algorithms, the RSLP (Removedor de Sufixos da Lingua Portuguesa) possessed the greatest capacity of dimensionality reduction of the data. In the second one, through the evaluation of the stemming algorithms on the legal documents retrieval, the RSLP-S (Removedor de Sufixos da Lingua Portuguesa Singular) and UniNE (University of Neuchâtel), less aggressive stemmers, presented the best cost-benefit ratio, since they reduced the dimensionality of the data and increased the effectiveness of the information retrieval evaluation metrics in one of analyzed collections
    corecore