2 research outputs found

    Authenticity of Geo-Location and Place Name in Tweets

    Get PDF
    The place name and geo-coordinates of tweets are supposed to represent the possible location of the user at the time of posting that tweet. However, our analysis over a large collection of tweets indicates that these fields may not give the correct location of the user at the time of posting that tweet. Our investigation reveals that the tweets posted through third party applications such as Instagram or Swarmapp contain the geo-coordinate of the user specified location, not his current location. Any place name can be entered by a user to be displayed on a tweet. It may not be same as his/her exact location. Our analysis revealed that around 12% of tweets contains place names which are different from their real location. The findings of this research can be used as caution while designing location-based services using social media

    Helve'tweet: exploration d'un million de tweets géolocalisés en Suisse, février-août 2017

    Get PDF
    Réseau social utilisé activement par 8% de la population suisse, Twitter permet à ses utilisateurs de géolocaliser leurs messages. Cette étude exploratoire quantitative, basée sur des messages géolocalisés en Suisse écrits entre le 18 février et le 31 août 2017, fait suite au projet GEoTweet consacré aux tweets genevois en 2014-2015. Elle se propose de répondre à trois questions de recherche pour évaluer les possibilités et les limites de l’utilisation des données fournies par l’API de Twitter lors des recherches sur la Suisse, dans les domaines de la sociologie des données et des sciences de l’information. Le focus est porté plus spécifiquement sur l’exploitation des données de géolocalisation, sur la problématique de l’identification des langues et sur les critères définissant un tweet suisse dans une perspective d’archivage. Après l’introduction et la revue de littérature, le rapport présente la méthodologie utilisée, les biais identifiés et les outils créés pour les mesurer, les éviter ou du moins les minimiser. Une concordance a ainsi été créée entre les place.id de Twitter et la liste officielle des communes suisses pour pallier au caractère non vérifié (en partie obsolètes, en partie erronées) des données géographiques fournies par Twitter. Trois séries de tests ont également été menés pour vérifier la fiabilité de l’algorithme de reconnaissance de langue de Twitter pour l’échantillon. Ils montrent une marge d’erreur de 4,25% sur les grandes langues européennes, mais qui peut monter jusqu’à 92% pour une langue « exotique » comme l’indonésien. Les analyses des tweets et des twittos ont permis de dégager des résultats importants. D’une part, elles montrent les fortes variations de leur nombre et de leur diversité linguistique à travers l’espace et le temps (p.ex. plus de comptes actifs en Suisse alémanique, mais plus de tweets en français dans l’ensemble ; plus de tweets pendant les périodes de vacances, mais baisse de la proportion des tweets et des twittos en langues nationales et en anglais). D’autre part la durée et l’étendue géographique de leur activité sont très variables (p.ex. 82% des comptes avec moins de 10 tweets, 68% actifs pendant un seul mois et 71% dans un seul canton). Des hypothèses ont été formulées et vérifiées pour expliquer ces résultats qui relèvent de la propension élevée des germanophones à twitter en anglais et de l’effet positif des loisirs sur l’envie et l’opportunité de twitter avec géolocalisation. Dans la dernière partie, l’étude propose des pistes afin d’établir des critères pour reconnaître un tweet suisse, en se basant sur les analyses menées préalablement ainsi que sur les expériences menées dans d’autres pays du monde. Le contexte international et suisse de l’archivage des tweets est abordé, sans prétention de vouloir proposer une méthode, au vu de la complexité des enjeux sociologiques, techniques et légaux
    corecore