Análisis de frecuencia de hashtags en Twitter

Abstract

[ES] En este trabajo se realiza un análisis del comportamiento de los hashtags en una conversación de Twitter, estudiando cómo se distribuye su frecuencia de acuerdo a su popularidad. Se ha observado que se sigue una distribución potencial, según lo esperado por la Ley de Zipf, que indica que existen pocos hashtags con mucha repercusión y muchos que no han tenido mucho éxito. Debido al comportamiento humano en estas redes, muchos de los hashtags no han alcanzado gran repercusión debido a que contienen alguna falta de ortografía o están mal escritos. Para corregir esto se han utilizado distancias de edición de cadenas que han permitido agrupar los hashtags similares entre sí para disminuir el efecto de los hashtags escritos de manera errónea en los estudios realizados. También se muestra la aplicación que tiene la Ley de Benford aplicada al estudio del comportamiento de los usuarios en las redes sociales, donde las distribuciones del primer y segundo dígito más significativo de las frecuencias de los hashtags siguen la distribución esperada por Benford. Esto permite que se pueda utilizar para validar datos provenientes de Twitter y analizarlos en busca de comportamientos sospechosos.[EN] This paper presents an analysis of hashtag’s behaviour in a conversation in Twitter by studying the frecuency distribution according to their popularity. It has been observed that follows a power law, as espected by Zipf’s Law, which states that there are few hastags with huge impact and many others who have not been very successful. Due to the human’s behaviour in social networks, many hashtags have not achieved a great impact because they contain mispelling errors. String distances has been used to correct the errors to group similar hashtags together to decrease the possible impact of these hashtags for future studies. It is also shown that Benford’s Law could be applied to study the user’s behaviour in social networks, where the first and second significant digit distribution of hashtag’s frequencies follow the expected Benford’s distribution and allow it’s use to validate data from Twitter and analyze it for suspicious behaviours.Pérez Melián, JA. (2016). Análisis de frecuencia de hashtags en Twitter. http://hdl.handle.net/10251/71616.TFG

    Similar works

    Full text

    thumbnail-image

    Available Versions