1 research outputs found
Uma abordagem unificada para análise de sentimento de tweets com domĂnio especĂfico
Dissertação (mestrado)—Universidade de BrasĂlia, Instituto de CiĂŞncias Exatas, Departamento de CiĂŞncia da Computação, 2015.Twitter Ă© uma rede social online que permite que os usuários enviem e leiam mensagens curtas chamadas tweets. Em dezembro de 2014, o Twitter possuia mais de 500 milhões de usuários, dos quais mais de 284 milhões sĂŁo usuários ativos, gerando aproximadamente 500 milhões de tweets todos os dias. O uso massivo de redes sociais online está atraindo atenção da academia e de empresas para o estudo da análise de sentimento, especialmente o Twitter, atravĂ©s da Análise de Sentimento de Tweets (AST). Essa análise proporciona insights sobre a opiniĂŁo do pĂşblico sobre vários tĂłpicos, como polĂtica, notĂcias e produtos. Para executar AST eficientemente em um domĂnio especĂfico, uma abordagem com uma ferramenta unificada Ă© proposta. Essa abordagem possui quatro passos: coletar tweets relacionados ao domĂnio, identificar e excluir tweets que sĂŁo spam, construir um lĂ©xico de sentimento especĂfico para o domĂnio e analisar o sentimento dos tweets válidos. O lĂ©xico Ă© um elemento chave que deve ser especĂfico para domĂnio para poder incorporar expressões cujo sentimento varia de um domĂnio para outro. A ferramenta de AST proposta foi implementada e testada nos domĂnios ’iPhone 6 ’ e ’cigarros eletrĂ´nicos’ e obteve resultados convincentes nas quatro etapas, mostrando a superioridade de uma ferramenta de AST especĂfica para domĂnio em relação a uma genĂ©rica.Twitter is an online social networking (OSN) service that enables users to send and read short messages called "tweets". As of December 2014, Twitter has more than 500 million users, out of which more than 284 million are active users and about 500 million tweets are posted every day. The massive use of online social networks is attracting great attention to the study of sentiment analysis, specially Tweet Sentiment Analysis (TSA). This analysis provides insights into the opinion of the public on various topics, from political affairs, hot news to commercial products. In order to execute efficient TSA on a particular topic or domain, an approach with a unified tool is proposed. This approach consists of four steps: collecting tweets related to that topic, identifying and excluding spam tweets, building a domain-specific sentiment lexicon and analyzing the sentiment of tweets. Among them, the lexicon is a key element that is domain-specific as well as incorporates expressions whose sentiment varies from one domain to another. The proposed TSA tool is tested on the ’iPhone 6’ and ’electronic cigarettes’ domains which obtains convincing results in all of the four phases, showing the superiority of the domain-specific TSA tool over a generic one