205 research outputs found

    Analyse de l’image de marque sur le Web 2.0

    Get PDF
    Analyse of entities representation over the Web 2.0Every day, millions of people publish their views on Web 2.0 (social networks,blogs, etc.). These comments focus on subjects as diverse as news, politics,sports scores, consumer objects, etc. The accumulation and agglomerationof these notices on an entity (be it a product, a company or a public entity) givebirth to the brand image of that entity. Internet has become in recent years aprivileged place for the emergence and dissemination of opinions and puttingWeb 2.0 at the head of observatories of opinions. The latter being a means ofaccessing the knowledge of the opinion of the world population.The image is here understood as the idea that a person or a group of peopleis that entity. This idea carries a priori on a particular subject and is onlyvalid in context for a given time. This perceived image is different from theentity initially wanted to broadcast (eg via a communication campaign). Moreover,in reality, there are several images in the end living together in parallel onthe network, each specific to a community and all evolve differently over time(imagine how would be perceived in each camp together two politicians edgesopposite). Finally, in addition to the controversy caused by the voluntary behaviorof some entities to attract attention (think of the declarations required orshocking). It also happens that the dissemination of an image beyond the frameworkthat governed the and sometimes turns against the entity (for example,« marriage for all » became « the demonstration for all »). The views expressedthen are so many clues to understand the logic of construction and evolution ofthese images. The aim is to be able to know what we are talking about and howwe talk with filigree opportunity to know who is speaking.viiIn this thesis we propose to use several simple supervised statistical automaticmethods to monitor entity’s online reputation based on textual contentsmentioning it. More precisely we look the most important contents and theirsauthors (from a reputation manager point-of-view). We introduce an optimizationprocess allowing us to enrich the data using a simulated relevance feedback(without any human involvement). We also compare content contextualizationmethod using information retrieval and automatic summarization methods.Wealso propose a reflection and a new approach to model online reputation, improveand evaluate reputation monitoring methods using Partial Least SquaresPath Modelling (PLS-PM). In designing the system, we wanted to address localand global context of the reputation. That is to say the features can explain thedecision and the correlation betweens topics and reputation. The goal of ourwork was to propose a different way to combine usual methods and featuresthat may render reputation monitoring systems more accurate than the existingones. We evaluate and compare our systems using state of the art frameworks: Imagiweb and RepLab. The performances of our proposals are comparableto the state of the art. In addition, the fact that we provide reputation modelsmake our methods even more attractive for reputation manager or scientistsfrom various fields.Image sur le web : analyse de la dynamique des images sur le Web 2.0. En plus d’ĂȘtre un moyen d’accĂšs Ă  la connaissance, Internet est devenu en quelques annĂ©es un lieu privilĂ©giĂ© pour l’apparition et la diffusion d’opinions.Chaque jour, des millions d’individus publient leurs avis sur le Web 2.0 (rĂ©seaux sociaux, blogs, etc.). Ces commentaires portent sur des sujets aussi variĂ©s que l’actualitĂ©, la politique, les rĂ©sultats sportifs, biens culturels, des objets de consommation, etc. L’amoncellement et l’agglomĂ©ration de ces avis publiĂ©s sur une entitĂ© (qu’il s’agisse d’un produit, une entreprise ou une personnalitĂ© publique)donnent naissance Ă  l’image de marque de cette entitĂ©.L’image d’une entitĂ© est ici comprise comme l’idĂ©e qu’une personne ou qu’un groupe de personnes se fait de cette entitĂ©. Cette idĂ©e porte a priori sur un sujet particulier et n’est valable que dans un contexte, Ă  un instant donnĂ©.Cette image perçue est par nature diffĂ©rente de celle que l’entitĂ© souhaitait initialement diffuser (par exemple via une campagne de communication). De plus,dans la rĂ©alitĂ©, il existe au final plusieurs images qui cohabitent en parallĂšle sur le rĂ©seau, chacune propre Ă  une communautĂ© et toutes Ă©voluant diffĂ©remment au fil du temps (imaginons comment serait perçu dans chaque camp le rapprochement de deux hommes politiques de bords opposĂ©s). Enfin, en plus des polĂ©miques volontairement provoquĂ©es par le comportement de certaines entitĂ©s en vue d’attirer l’attention sur elles (pensons aux tenues ou dĂ©clarations choquantes), il arrive Ă©galement que la diffusion d’une image dĂ©passe le cadre qui la rĂ©gissait et mĂȘme parfois se retourne contre l’entitĂ© (par exemple, «le mariage pour tous» devenu « la manif pour tous »). Les opinions exprimĂ©es constituent alors autant d’indices permettant de comprendre la logique de construction et d’évolution de ces images. Ce travail d’analyse est jusqu’à prĂ©sent confiĂ© Ă  des spĂ©cialistes de l’e-communication qui monnaient leur subjectivitĂ©. Ces derniers ne peuvent considĂ©rer qu’un volume restreint d’information et ne sont que rarement d’accord entre eux. Dans cette thĂšse, nous proposons d’utiliser diffĂ©rentes mĂ©thodes automatiques, statistiques, supervisĂ©es et d’une faible complexitĂ© permettant d’analyser et reprĂ©senter l’image de marque d’entitĂ© Ă  partir de contenus textuels les mentionnant. Plus spĂ©cifiquement, nous cherchons Ă  identifier les contenus(ainsi que leurs auteurs) qui sont les plus prĂ©judiciables Ă  l’image de marque d’une entitĂ©. Nous introduisons un processus d’optimisation automatique de ces mĂ©thodes automatiques permettant d’enrichir les donnĂ©es en utilisant un retour de pertinence simulĂ© (sans qu’aucune action de la part de l’entitĂ© concernĂ©e ne soit nĂ©cessaire). Nous comparer Ă©galement plusieurs approches de contextualisation de messages courts Ă  partir de mĂ©thodes de recherche d’information et de rĂ©sumĂ© automatique. Nous tirons Ă©galement parti d’algorithmes de modĂ©lisation(tels que la RĂ©gression des moindres carrĂ©s partiels), dans le cadre d’une modĂ©lisation conceptuelle de l’image de marque, pour amĂ©liorer nos systĂšmes automatiques de catĂ©gorisation de documents textuels. Ces mĂ©thodes de modĂ©lisation et notamment les reprĂ©sentations des corrĂ©lations entre les diffĂ©rents concepts que nous manipulons nous permettent de reprĂ©senter d’une part, le contexte thĂ©matique d’une requĂȘte de l’entitĂ© et d’autre, le contexte gĂ©nĂ©ral de son image de marque. Nous expĂ©rimentons l’utilisation et la combinaison de diffĂ©rentes sources d’information gĂ©nĂ©rales reprĂ©sentant les grands types d’information auxquels nous sommes confrontĂ©s sur internet : de long les contenus objectifs rĂ©digĂ©s Ă  des informatives, les contenus brefs gĂ©nĂ©rĂ©s par les utilisateurs visant Ă  partager des opinions. Nous Ă©valuons nos approches en utilisant deux collections de donnĂ©es, la premiĂšre est celle constituĂ©e dans le cadre du projet Imagiweb, la seconde est la collection de rĂ©fĂ©rence sur le sujet : CLEFRepLa

    Fraudes, violences et autres comportements déviants dans le sport professionnel et olympique : Opportunités et limites des sources ouvertes en ligne comme moyen de renseignement

    Get PDF
    Les sources ouvertes en ligne sont de plus en plus utilisĂ©es comme outils de renseignement. Cette contribution explore la maniĂšre dont elles peuvent ĂȘtre utilisĂ©es pour Ă©tudier la dĂ©viance dans le sport professionnel et olympique. L’étude a considĂ©rĂ© les fraudes perpĂ©trĂ©es sur le terrain (le dopage, la manipulation de match et les fraudes Ă  l’éligibilitĂ©) et en dehors (la corruption), les violences sur et en dehors du terrain de jeu (le hooliganisme et le terrorisme), ainsi que les autres comportements prĂ©judiciables commis par les sportifs, que ce soit sur le terrain ou en dehors. Un dispositif de veille en ligne a Ă©tĂ© mis en place pour la rĂ©colte d’articles publiĂ©s en 2016 en anglais. Des 775 cas qui ont Ă©tĂ© relevĂ©s, les fraudes (surtout les cas de dopage et de manipulations de matchs) comptaient Ă  elles seules pour 85 % des cas. Au total, 87 pays sont impliquĂ©s dans cette Ă©tude, bien que certaines sous-rĂ©gions – l’Europe de l’Est (17,4 %), l’Afrique de l’Est (16,1 %), ainsi que l’Australie et la Nouvelle-ZĂ©lande (10,2 %) – se dĂ©marquent par une concentration plus Ă©levĂ©e de cas. Quant aux patterns temporels, des distributions sont concentrĂ©es surtout aux mois d’aoĂ»t et novembre pour les fraudes, et aux mois de juin et juillet pour les violences. Ces tendances peuvent laisser supposer une saisonnalitĂ© des comportements dĂ©viants. En se concentrant sur les biais liĂ©s au langage et aux types de sources, des recherches plus approfondies sur le sujet pourraient contribuer Ă  une surveillance systĂ©matique de la reprĂ©sentation mĂ©diatique de ces phĂ©nomĂšnes dans le monde

    Regards croisés sur la veille

    Get PDF
    La veille et la recherche d’informations, qu’elles soient sur et par le web ou non, sont des pratiques indispensables Ă  de nombreux mĂ©tiers : communication, marketing, RH, web... L’objectif de ce livre blanc est d’apporter, modestement, des visions et des mĂ©thodologies variĂ©es sur ces pratiques. Le constat de dĂ©part qui a amenĂ© Ă  cet ouvrage est le suivant : la veille tout le monde en parle et en fait (ou presque), alors comment enrichir l’existant ? Les multiples apports qui constituent cette pratique et cette profession, qu’ils proviennent de la documentation, de l’intelligence Ă©conomique ou encore du web, rendent riches les possibilitĂ©s d’analyse. Nous avons donc pris le parti ici de ne pas viser l’exhaustivitĂ© (impossible de toute maniĂšre) mais de creuser certains aspects, certaines pratiques liĂ©es : cartographie, mind mapping, innovation, recrutement, qualification des sources... Et ce en faisant appel Ă  des spĂ©cialistes de ces domaines et Ă  des veilleurs professionnels. Pour ne pas ĂȘtre trop thĂ©orique et surtout ramener la veille Ă  ce qu’elle est, Ă  la fois une compĂ©tence et un mĂ©tier Ă  part entiĂšre, cet e-book propose aussi de nombreuses interviews de professionnels. Professionnels dont les activitĂ©s de veille ne sont pas des tĂąches Ă  plein temps, mais font partie de leurs activitĂ©s quotidiennes. Et qui Ă©claireront sĂ»rement, nous l’espĂ©rons, sous un angle trĂšs pragmatique certaines de vos interrogations. L’idĂ©e est de vous fournir une vision large : des trucs et astuces pour mener une veille quotidienne aux pratiques plus avancĂ©es. Ceci afin de montrer que si la veille est accessible Ă  tous (surtout grĂące aux outils web), elle peut aussi rĂ©vĂ©ler certains aspects complexes Ă  ne pas nĂ©gliger. En parlant d’outils, vous remarquerez que l’accent n’a pas Ă©tĂ© portĂ© sur eux. PlutĂŽt que de faire une longue liste de tutoriaux, il nous a paru plus intĂ©ressant de se focaliser sur les mĂ©thodologies et les bonnes pratiques, la maĂźtrise des outils n’étant souvent qu’un moyen plus qu’un objectif Ă  atteindre. Au final, ce livre blanc vise Ă  la fois Ă  Ă©largir votre champ de vision, renforcer vos connaissances sur certains aspects, et vous donner quelques armes pour dĂ©velopper votre propre stratĂ©gie de veille. Cet objectif Ă©tant ambitieux, nous remercions les auteurs et interviewĂ©s pour le temps, l’énergie et la crĂ©ativitĂ© qu’ils ont dĂ©veloppĂ© pour l’atteindre. Mais aussi la graphiste Morgane Maillard pour les crĂ©as qui mettent en valeur ce contenu

    Découverte et analyse des communautés implicites par une approche sémantique en ligne (l'outil WebTribe)

    Get PDF
    Avec l essor du Web 2.0 et des technologies collaboratives qui y sont rattachées,le Web est aujourd hui devenu une vaste plate-forme d échanges entre internautes.La majeure partie des sites Web sont actuellement soit dédiés aux interactionssociales de leurs utilisateurs, soit proposent des outils pour développer ces interactions.Nos travaux portent sur la compréhension de ces échanges, ainsi que desstructures communautaires qui en découlent, au moyen d une approche sémantique.Pour répondre aux besoins de compréhension propres aux analystes de siteWeb et autres gestionnaires de communautés, nous analysons ces structures communautairespour en extraire des caractéristiques essentielles comme leurs centresthématiques et contributeurs centraux. Notre analyse sémantique s appuie notammentsur des ontologies légÚres de référence pour définir plusieurs nouvelles métriques,comme la centralité sémantique temporelle et la probabilité de propagationsémantique. Nous employons une approche en ligne afin de suivre l activitéutilisateur en temps réel, au sein de notre outil d analyse communautaire Web-Tribe. Nous avons implémenté et testé nos méthodes sur des données extraites desystÚmes réels de communication sociale sur le WebWith the rise of Web 2.0 and collaborative technologies that are attached to,the Web has now become a broad platform of exchanges between users. The majorityof websites is now dedicated to social interactions of their users, or offerstools to develop these interactions. Our work focuses on the understanding of theseexchanges, as well as emerging community structures arising, through a semanticapproach. To meet the needs of web analysts, we analyze these community structuresto identify their essential characteristics as their thematic centers and centralcontributors. Our semantic analysis is mainly based on reference light ontologiesto define several new metrics such as the temporal semantic centrality and thesemantic propagation probability. We employ an online approach to monitor useractivity in real time in our community analysis tool WebTribe. We have implementedand tested our methods on real data from social communication systemson the WebDIJON-BU Doc.électronique (212319901) / SudocSudocFranceF

    Fouille de données de santé

    Get PDF
    Dans le domaine de la santĂ©, les techniques d’analyse de donnĂ©es sont de plus en plus populaires et se rĂ©vĂšlent mĂȘme indispensables pour gĂ©rer les gros volumes de donnĂ©es produits pour un patient et par le patient. Deux thĂ©matiques seront abordĂ©es dans cette prĂ©sentation d'HDR.La premiĂšre porte sur la dĂ©finition, la formalisation, l’implĂ©mentation et la validation de mĂ©thodes d’analyse permettant de dĂ©crire le contenu de bases de donnĂ©es mĂ©dicales. Je me suis particuliĂšrement intĂ©ressĂ©e aux donnĂ©es sĂ©quentielles. J’ai fait Ă©voluer la classique notion de motif sĂ©quentiel pour y intĂ©grer des composantes contextuelles, spatiales et sur l’ordre partiel des Ă©lĂ©ments composant les motifs. Ces nouvelles informations enrichissent la sĂ©mantique initiale de ces motifs.La seconde thĂ©matique se focalise sur l’analyse des productions et des interactions des patients au travers des mĂ©dias sociaux. J’ai principalement travaillĂ© sur des mĂ©thodes permettant d’analyser les productions narratives des patients selon leurs temporalitĂ©s, leurs thĂ©matiques, les sentiments associĂ©s ou encore le rĂŽle et la rĂ©putation du locuteur s’étant exprimĂ© dans les messages

    Etude de l'ambiguĂŻtĂ© des requĂȘtes dans un moteur de recherche spĂ©cialisĂ© dans l'actualitĂ© : exploitation d'indices contextuels

    Get PDF
    In this thesis, we consider the question of the ambiguity of queries submitted to a search engine in a particular area that is news.We build on recent work in the field of information retrieval (IR) that showed the addition of contextual information to better identify and address more adequately the information need. On this basis, we make the hypothesis that the elements of information available in an application of IR (contexts in the collection of documents, repetitions and reformulations of queries, diachronic dimension of the search) can help us to examine this problem of ambiguity. We also postulate that ambiguity will manifest in the results returned by a search engine. In this purpose to evaluate these hypotheses, we set up a device to study the ambiguity of queries based on a method of thematic categorization of queries, which relies on an expert categorization. We then show that this ambiguity is different which is indicated by an encyclopedic resources such as Wikipedia.We evaluate this categorization device by setting up two user tests. Finally, we carry out a study based on a set of contextual clues in order to understand the global behavior of a query.Dans cette thĂšse, nous envisageons la question de l’ambiguĂŻtĂ© des requĂȘtes soumises Ă  un moteur de recherche dans un domaine particulier qui est l’actualitĂ©. Nous nous appuyons sur les travaux rĂ©cents dans le domaine de la recherche d’information (RI) qui ont montrĂ© l’apport d’informations contextuelles pour mieux cerner et traiter plus adĂ©quatement le besoin informationnel. Nous faisons ainsi l’hypothĂšse que les Ă©lĂ©ments d’information disponibles dans une application de RI (contextes prĂ©sents dans la base documentaire, rĂ©pĂ©titions et reformulations de requĂȘtes, dimension diachronique de la recherche) peuvent nous aider Ă  Ă©tudier ce problĂšme d’ambiguĂŻtĂ©. Nous faisons Ă©galement l’hypothĂšse que l’ambiguĂŻtĂ© va se manifester dans les rĂ©sultats ramenĂ©s par un moteur de recherche. Dans ce but, nous avons mis en place un dispositif pour Ă©tudier l’ambiguĂŻtĂ© des requĂȘtes reposant sur une mĂ©thode de catĂ©gorisation thĂ©matique des requĂȘtes, qui s’appuie sur unecatĂ©gorisation experte. Nous avons ensuite montrĂ© que cette ambiguĂŻtĂ© est diffĂ©rente de celle repĂ©rĂ©e par une ressource encyclopĂ©dique telle que WikipĂ©dia. Nous avons Ă©valuĂ© ce dispositif de catĂ©gorisation en mettant en place deux tests utilisateurs. Enfin, nous fournissons une Ă©tude basĂ©e sur un faisceau d’indices contextuels afin de saisir le comportement global d’une requĂȘte

    La réalité augmentée en médiathÚque: une aide à la valorisation des collections ? : réflexion autour d'une application mobile de réalité augmentée pour la MédiathÚque Valais-Sion

    Get PDF
    La rĂ©alitĂ© augmentĂ©e est une technologie Ă©mergente qui intrigue et surprend. Parfois considĂ©rĂ©e comme un gadget numĂ©rique, un effet de mode qui finira par s’estomper avec le temps, parfois dĂ©finie comme une technologie ambitieuse capable de rĂ©volutionner notre rapport au numĂ©rique, elle peine encore Ă  faire l’unanimitĂ© auprĂšs des professionnels de l’information. Et pour cause, il n’existe Ă  ce jour que peu d’exemples concrets d’utilisations des technologies de rĂ©alitĂ© augmentĂ©e liĂ©s au domaine des bibliothĂšques sur lesquels les professionnels peuvent s’appuyer. Afin de clarifier la situation de la rĂ©alitĂ© augmentĂ©e et permettre aux bibliothĂ©caires de de mieux envisager son utilisation dans un milieu bibliothĂ©conomique, il sera question, dans ce travail, de proposer une vue d’ensemble de cette technologie ; ainsi, plusieurs Ă©lĂ©ments essentiels Ă  la bonne comprĂ©hension de la rĂ©alitĂ© augmentĂ©e seront prĂ©sentĂ©s, comme son historique, son fonctionnement, son marchĂ© et les diffĂ©rents domaines et projets qui la concernent. Une fois cette premiĂšre base Ă©tablie, une rĂ©flexion quant Ă  l’utilisation de la rĂ©alitĂ© augmentĂ©e dans le cadre d’une problĂ©matique de valorisation des collections sera proposĂ©e. Une rĂ©flexion qui permettra d’aborder, non seulement la MĂ©diathĂšque Valais et son contexte, mais aussi les points essentiels, prĂ©alables et techniques Ă  prendre en compte lors de la rĂ©alisation d’une technologie de rĂ©alitĂ© augmentĂ©e en bibliothĂšque ou mĂ©diathĂšque. Tout ceci, afin de permettre, Ă  la MĂ©diathĂšque Valais-Sion et aux professionnels intĂ©ressĂ©s, une meilleure appropriation de la technologie. Enfin, sur la base des diffĂ©rents Ă©lĂ©ments Ă©voquĂ©s dans ce travail, sera proposĂ©e une sĂ©lection de fonctionnalitĂ©s rĂ©alistes mettant en scĂšne la rĂ©alitĂ© augmentĂ©e que la MĂ©diathĂšque Valais-Sion pourrait mettre en place

    Analyse de publications sociomédiatiques portant sur la nutrition en temps de COVID-19

    Get PDF
    Les mĂ©dias sociaux sont de plus en plus consultĂ©s afin d'obtenir de l'information relative Ă  la santĂ©. NĂ©anmoins, aux cĂŽtĂ©s de l'information juste et fiable y circulent des messages trompeurs ou faux. ParallĂšlement, depuis son Ă©mergence, la pandĂ©mie de COVID-19 a Ă©tĂ© un sujet de discussion notable en ligne comme hors ligne. Plus particuliĂšrement, les liens entre la nutrition et la COVID-19 ont Ă©tĂ© abordĂ©s sur les mĂ©dias sociaux, dont Twitter, tant par des professionnels de la santĂ© que le public. Ces nombreux liens reprĂ©sentent d'ailleurs un domaine d'intĂ©rĂȘt en recherche. Ainsi, l'objectif principal de ce projet est de comparer le comportement de publication quant Ă  la nutrition et la COVID-19 de diĂ©tĂ©tistes et du public d'abonnĂ©s Twitter en analysant leurs tweets Ă  cet effet selon leurs thĂšmes et l'engagement reçu des lecteurs. Des objectifs secondaires ont Ă©tĂ© Ă©tablis, dont comparer la justesse du contenu des tweets entre les groupes et dĂ©terminer si les tweets de ces derniers ont le potentiel d'influencer le comportement. Les principaux rĂ©sultats indiquent qu'il existe plusieurs diffĂ©rences entre les groupes quant aux thĂšmes qu'ils abordent, aux formes d'engagement qu'ils reçoivent des usagers et aux domaines de changement de comportement qu'ils utilisent. Enfin, les publications des diĂ©tĂ©tistes sont gĂ©nĂ©ralement plus justes que ceux du public. Ces travaux de recherche contribuent Ă  encourager la discussion quant au rĂŽle des diĂ©tĂ©tistes sur les mĂ©dias sociaux et Ă  informer le dĂ©veloppement d'interventions sociomĂ©diatiques en temps opportun lors de crises sanitaires et ce, afin de contrer la mĂ©sinformation et la dĂ©sinformation.Social media are being more and more consulted as sources of health-related information. However, on these platforms, accurate and reliable information is coexisting with misleading and false messages. In parallel, since its emergence, the COVID-19 pandemic has been a notable subject of discussion, online and offline. More specifically, the links between nutrition and COVID-19 have been addressed on social media, including Twitter, by health professionals and the public alike. Besides, these numerous links represent a field of interest in research. Hence, the main objective of this project is to compare the publication behavior related to nutrition and COVID-19 of dietitians and the public of Twitter users by analyzing their tweets to this regard in terms of their themes and the engagement they received from users. Secondary objectives have been established, including comparing the tweets' content accuracy between groups, and determining whether their tweets have the potential to influence behavior. Main results indicate that many differences exist between groups with regards to the themes they discuss, the forms of user engagement they receive, and the behavior change domains they use. Lastly, dietitians' posts are generally more accurate than the public's. This master's thesis contributes to further the discussion on the dietitians' role on social media and to inform the development of timely interventions on such platforms during health crises to counter misinformation and disinformation
    • 

    corecore