28 research outputs found

    Détection de points de vue sur les médias sociaux numériques

    Get PDF
    De nombreux domaines ont intérêt à étudier les points de vue exprimés en ligne, que ce soit à des fins de marketing, de cybersécurité ou de recherche avec l'essor des humanités numériques. Nous proposons dans ce manuscrit deux contributions au domaine de la fouille de points de vue, axées sur la difficulté à obtenir des données annotées de qualité sur les médias sociaux. Notre première contribution est un jeu de données volumineux et complexe de 22853 profils Twitter actifs durant la campagne présidentielle française de 2017. C'est l'un des rares jeux de données considérant plus de deux points de vue et, à notre connaissance, le premier avec un grand nombre de profils et le premier proposant des communautés politiques recouvrantes. Ce jeu de données peut être utilisé tel quel pour étudier les mécanismes de campagne sur Twitter ou pour évaluer des modèles de détection de points de vue ou des outils d'analyse de réseaux. Nous proposons ensuite deux modèles génériques semi-supervisés de détection de points de vue, utilisant une poignée de profils-graines, pour lesquels nous connaissons le point de vue, afin de catégoriser le reste des profils en exploitant différentes proximités inter-profils. En effet, les modèles actuels sont généralement fondés sur les spécificités de certaines plateformes sociales, ce qui ne permet pas l'intégration de la multitude de signaux disponibles. En construisant des proximités à partir de différents types d'éléments disponibles sur les médias sociaux, nous pouvons détecter des profils suffisamment proches pour supposer qu'ils partagent une position similaire sur un sujet donné, quelle que soit la plateforme. Notre premier modèle est un modèle ensembliste séquentiel propageant les points de vue grâce à un graphe multicouche représentant les proximités entre les profils. En utilisant des jeux de données provenant de deux plateformes, nous montrons qu'en combinant plusieurs types de proximité, nous pouvons correctement étiqueter 98% des profils. Notre deuxième modèle nous permet d'observer l'évolution des points de vue des profils pendant un événement, avec seulement un profil-graine par point de vue. Ce modèle confirme qu'une grande majorité de profils ne changent pas de position sur les médias sociaux, ou n'expriment pas leur revirement.Numerous domains have interests in studying the viewpoints expressed online, be it for marketing, cybersecurity, or research purposes with the rise of computational social sciences. We propose in this manuscript two contributions to the field of stance detection, focused around the difficulty of obtaining annotated data of quality on social medias. Our first contribution is a large and complex dataset of 22853 Twitter profiles active during the French presidential campaign of 2017. This is one of the rare datasets that considers a non-binary stance classification and, to our knowledge, the first one with a large number of profiles, and the first one proposing overlapping political communities. This dataset can be used as-is to study the campaign mechanisms on Twitter, or used to test stance detection models or network analysis tools. We then propose two semi-supervised generic stance detection models using a handful of seed profiles for which we know the stance to classify the rest of the profiles by exploiting various proximities. Indeed, current stance detection models are usually grounded on the specificities of some social platforms, which is unfortunate since it does not allow the integration of the multitude of available signals. By infering proximities from differents types of elements available on social medias, we can detect profiles close enough to assume they share a similar stance on a given subject. Our first model is a sequential ensemble algorithm which propagates stances thanks to a multi-layer graph representing proximities between profiles. Using datasets from two platforms, we show that, by combining several types of proximities, we can achieve excellent results. Our second model allows us to observe the evolution of profiles' stances during an event with as little as one seed profile by stance. This model confirms that a large majority of profiles do not change their stance on social medias, or do not express their change of heart

    Panorama de l'informatique

    No full text
    DoctoralFormation de 4h pour Médiad'Oc (Université Fédérale de Toulouse)1) Une brève définition2) 40 hommes et femmes ayant marqué l'histoire de l'informatique3) Les différents domaines4) La recherche en informatique5) Dans la région Midi-Pyrénées-Languedoc-Roussillo

    Intégration du contexte spatio-temporel et social pour l'analyse de sentiments sur Twitter

    Get PDF
    International audienceContexte : L’analyse de sentiments est un domaine attirant beaucoup d’attention depuis quelques années. Ceci est notamment dû au fait que l’explosion des médias sociaux a permis à n’importe quelle personne disposant d’un accès au net de s’exprimer publiquement. Le domaine bénéficiant d’un transfert très rapide vers le monde industriel, de nombreuses entreprises sont apparues sur le marché (Viralheat, Brand24, Linkfluence,...)

    Découverte de points de vue sur les médias sociaux

    No full text
    Le séminaire « Savoirs, réseaux, médiations » du LISST combine les études sur les sciences et les analyses de réseaux sociaux autour d' une réflexion plus générale sur les formes sociales. Le séminaire est principalement dédié à la discussion de recherches empiriques en cours ou récentes, mais il organise également des échanges sur les théories des sciences sociales prenant en compte les relations interpersonnelles et les formes collectives

    Information Retrieval — Evaluation Campaigns

    No full text
    The notion of experimental evaluation can be traced back to 1958, with the Cranfield experiments. Nowadays, several evaluation campaigns perpetuate the philosophy behind this experiments: evaluating different systems on a common ground. This document presents evaluation campaigns from the Information Retrieval domain, with a particular focus on tasks dealing with sentiment analysis and social medias

    Détection des points de vue sur les médias sociaux numériques

    Get PDF
    Many domains have an interest in studying the stances expressed online, whether for marketing, cybersecurity or research with the rise of the digital humanities. In this manuscript, we propose two contributions to the field of stance detection, focusing on the difficulty of obtaining quality annotated data on social media. Our first contribution is a large and complex dataset of 22,853 active Twitter profiles during the 2017 French presidential campaign. This is one of the few datasets considering more than two stances and, to our knowledge, the first with a large number of profiles and the first proposing overlapping political communities. This dataset can be used as-is to study campaign mechanisms on Twitter or to evaluate stance detection models or network analysis tools. We then propose two semi-supervised generic stance detection models, using a handful of seed profiles, for which we know the stance, in order to categorize the rest of the profiles by exploiting different inter-profile proximities. Indeed, the current models are generally based on the specificities of certain social platforms, which does not allow the integration of the multitude of available signals. By building proximities from different types of elements available on social media, we can detect profiles close enough to assume that they share a similar stance on a given subject, regardless of the platform. Our first model is a sequential model propagating the stances thanks to a multilayer graph representing the proximities between the profiles. Using datasets from two platforms, we show that by combining several types of proximity, we can correctly label 98% of the profiles. Our second model allows us to observe the evolution of the profiles' stances during an event, with only one profile-seed per point of view. This model confirms that the vast majority of profiles do not change positions on social media, or do not express their change of opinion.De nombreux domaines ont intérêt à étudier les points de vue exprimés en ligne, que ce soit à des fins de marketing, de cybersécurité ou de recherche avec l'essor des humanités numériques. Nous proposons dans ce manuscrit deux contributions au domaine de la fouille de points de vue, axées sur la difficulté à obtenir des données annotées de qualité sur les médias sociaux. Notre première contribution est un jeu de données volumineux et complexe de 22853 profils Twitter actifs durant la campagne présidentielle française de 2017. C'est l'un des rares jeux de données considérant plus de deux points de vue et, à notre connaissance, le premier avec un grand nombre de profils et le premier proposant des communautés politiques recouvrantes. Ce jeu de données peut être utilisé tel quel pour étudier les mécanismes de campagne sur Twitter ou pour évaluer des modèles de détection de points de vue ou des outils d'analyse de réseaux. Nous proposons ensuite deux modèles génériques semi-supervisés de détection de points de vue, utilisant une poignée de profils-graines, pour lesquels nous connaissons le point de vue, afin de catégoriser le reste des profils en exploitant différentes proximités inter-profils. En effet, les modèles actuels sont généralement fondés sur les spécificités de certaines plateformes sociales, ce qui ne permet pas l'intégration de la multitude de signaux disponibles. En construisant des proximités à partir de différents types d'éléments disponibles sur les médias sociaux, nous pouvons détecter des profils suffisamment proches pour supposer qu'ils partagent une position similaire sur un sujet donné, quelle que soit la plateforme. Notre premier modèle est un modèle ensembliste séquentiel propageant les points de vue grâce à un graphe multicouche représentant les proximités entre les profils. En utilisant des jeux de données provenant de deux plateformes, nous montrons qu'en combinant plusieurs types de proximité, nous pouvons correctement étiqueter 98% des profils. Notre deuxième modèle nous permet d'observer l'évolution des points de vue des profils pendant un événement, avec seulement un profil-graine par point de vue. Ce modèle confirme qu'une grande majorité de profils ne changent pas de position sur les médias sociaux, ou n'expriment pas leur revirement

    Stance detection on digital social medias

    No full text
    De nombreux domaines ont intérêt à étudier les points de vue exprimés en ligne, que ce soit à des fins de marketing, de cybersécurité ou de recherche avec l'essor des humanités numériques. Nous proposons dans ce manuscrit deux contributions au domaine de la fouille de points de vue, axées sur la difficulté à obtenir des données annotées de qualité sur les médias sociaux. Notre première contribution est un jeu de données volumineux et complexe de 22853 profils Twitter actifs durant la campagne présidentielle française de 2017. C'est l'un des rares jeux de données considérant plus de deux points de vue et, à notre connaissance, le premier avec un grand nombre de profils et le premier proposant des communautés politiques recouvrantes. Ce jeu de données peut être utilisé tel quel pour étudier les mécanismes de campagne sur Twitter ou pour évaluer des modèles de détection de points de vue ou des outils d'analyse de réseaux. Nous proposons ensuite deux modèles génériques semi-supervisés de détection de points de vue, utilisant une poignée de profils-graines, pour lesquels nous connaissons le point de vue, afin de catégoriser le reste des profils en exploitant différentes proximités inter-profils. En effet, les modèles actuels sont généralement fondés sur les spécificités de certaines plateformes sociales, ce qui ne permet pas l'intégration de la multitude de signaux disponibles. En construisant des proximités à partir de différents types d'éléments disponibles sur les médias sociaux, nous pouvons détecter des profils suffisamment proches pour supposer qu'ils partagent une position similaire sur un sujet donné, quelle que soit la plateforme. Notre premier modèle est un modèle ensembliste séquentiel propageant les points de vue grâce à un graphe multicouche représentant les proximités entre les profils. En utilisant des jeux de données provenant de deux plateformes, nous montrons qu'en combinant plusieurs types de proximité, nous pouvons correctement étiqueter 98% des profils. Notre deuxième modèle nous permet d'observer l'évolution des points de vue des profils pendant un événement, avec seulement un profil-graine par point de vue. Ce modèle confirme qu'une grande majorité de profils ne changent pas de position sur les médias sociaux, ou n'expriment pas leur revirement.Numerous domains have interests in studying the viewpoints expressed online, be it for marketing, cybersecurity, or research purposes with the rise of computational social sciences. We propose in this manuscript two contributions to the field of stance detection, focused around the difficulty of obtaining annotated data of quality on social medias. Our first contribution is a large and complex dataset of 22853 Twitter profiles active during the French presidential campaign of 2017. This is one of the rare datasets that considers a non-binary stance classification and, to our knowledge, the first one with a large number of profiles, and the first one proposing overlapping political communities. This dataset can be used as-is to study the campaign mechanisms on Twitter, or used to test stance detection models or network analysis tools. We then propose two semi-supervised generic stance detection models using a handful of seed profiles for which we know the stance to classify the rest of the profiles by exploiting various proximities. Indeed, current stance detection models are usually grounded on the specificities of some social platforms, which is unfortunate since it does not allow the integration of the multitude of available signals. By infering proximities from differents types of elements available on social medias, we can detect profiles close enough to assume they share a similar stance on a given subject. Our first model is a sequential ensemble algorithm which propagates stances thanks to a multi-layer graph representing proximities between profiles. Using datasets from two platforms, we show that, by combining several types of proximities, we can achieve excellent results. Our second model allows us to observe the evolution of profiles' stances during an event with as little as one seed profile by stance. This model confirms that a large majority of profiles do not change their stance on social medias, or do not express their change of heart

    #Élysée2017fr: The 2017 French Presidential Campaign on Twitter

    No full text
    The French presidential election was one of the main political event of 2017, and triggered a lot of activity on Twitter. The campaign was highly unpredictable and led to the rise of 5 main parties instead of the historical bipartite (left-right) confrontation, ranging from far-left to far-right. This dataset paper proposes #Élysée2017fr, a large and complex dataset of 22853 Twitter profiles active during the campaign (from November 2016 to May 2017), and their corresponding tweets and retweets, plus the retweet and mention networks related to these profiles. The profiles were manually annotated with their political affiliations (up to 2 political parties per profile), their nature (individual or collective), and the sex of the profile's owner when available. This is one of the rare datasets that considers a non-binary stance classification and, to our knowledge, the first one with a large number of profiles, and the first one proposing overlapping political communities. This dataset can be used as-is to study the campaign mechanisms on Twitter, or used to test stance detection models or network analysis tools. Mining these data might reveal new insights on current issues like echo chambers or fake news diffusion

    Expression politique sur Twitter: les communautés comme indicateurs de point de vue

    No full text
    Présentation6ème édition des journées d'étude « Big Data Mining and Visualization » de l'association EGC, Université de LilleLe but de cette présentation est de présenter un nouveau modèle de détection de points de vue politique basé sur les communautés d'utilisateurs-trices sur les réseaux sociaux, en utilisant 2 cas d'études de 2014 : les élections législatives aux États-Unis et le référendum pour l'indépendance écossaise
    corecore