205 research outputs found
Analyse de lâimage de marque sur le Web 2.0
Analyse of entities representation over the Web 2.0Every day, millions of people publish their views on Web 2.0 (social networks,blogs, etc.). These comments focus on subjects as diverse as news, politics,sports scores, consumer objects, etc. The accumulation and agglomerationof these notices on an entity (be it a product, a company or a public entity) givebirth to the brand image of that entity. Internet has become in recent years aprivileged place for the emergence and dissemination of opinions and puttingWeb 2.0 at the head of observatories of opinions. The latter being a means ofaccessing the knowledge of the opinion of the world population.The image is here understood as the idea that a person or a group of peopleis that entity. This idea carries a priori on a particular subject and is onlyvalid in context for a given time. This perceived image is different from theentity initially wanted to broadcast (eg via a communication campaign). Moreover,in reality, there are several images in the end living together in parallel onthe network, each specific to a community and all evolve differently over time(imagine how would be perceived in each camp together two politicians edgesopposite). Finally, in addition to the controversy caused by the voluntary behaviorof some entities to attract attention (think of the declarations required orshocking). It also happens that the dissemination of an image beyond the frameworkthat governed the and sometimes turns against the entity (for example,« marriage for all » became « the demonstration for all »). The views expressedthen are so many clues to understand the logic of construction and evolution ofthese images. The aim is to be able to know what we are talking about and howwe talk with filigree opportunity to know who is speaking.viiIn this thesis we propose to use several simple supervised statistical automaticmethods to monitor entityâs online reputation based on textual contentsmentioning it. More precisely we look the most important contents and theirsauthors (from a reputation manager point-of-view). We introduce an optimizationprocess allowing us to enrich the data using a simulated relevance feedback(without any human involvement). We also compare content contextualizationmethod using information retrieval and automatic summarization methods.Wealso propose a reflection and a new approach to model online reputation, improveand evaluate reputation monitoring methods using Partial Least SquaresPath Modelling (PLS-PM). In designing the system, we wanted to address localand global context of the reputation. That is to say the features can explain thedecision and the correlation betweens topics and reputation. The goal of ourwork was to propose a different way to combine usual methods and featuresthat may render reputation monitoring systems more accurate than the existingones. We evaluate and compare our systems using state of the art frameworks: Imagiweb and RepLab. The performances of our proposals are comparableto the state of the art. In addition, the fact that we provide reputation modelsmake our methods even more attractive for reputation manager or scientistsfrom various fields.Image sur le web : analyse de la dynamique des images sur le Web 2.0. En plus dâĂȘtre un moyen dâaccĂšs Ă la connaissance, Internet est devenu en quelques annĂ©es un lieu privilĂ©giĂ© pour lâapparition et la diffusion dâopinions.Chaque jour, des millions dâindividus publient leurs avis sur le Web 2.0 (rĂ©seaux sociaux, blogs, etc.). Ces commentaires portent sur des sujets aussi variĂ©s que lâactualitĂ©, la politique, les rĂ©sultats sportifs, biens culturels, des objets de consommation, etc. Lâamoncellement et lâagglomĂ©ration de ces avis publiĂ©s sur une entitĂ© (quâil sâagisse dâun produit, une entreprise ou une personnalitĂ© publique)donnent naissance Ă lâimage de marque de cette entitĂ©.Lâimage dâune entitĂ© est ici comprise comme lâidĂ©e quâune personne ou quâun groupe de personnes se fait de cette entitĂ©. Cette idĂ©e porte a priori sur un sujet particulier et nâest valable que dans un contexte, Ă un instant donnĂ©.Cette image perçue est par nature diffĂ©rente de celle que lâentitĂ© souhaitait initialement diffuser (par exemple via une campagne de communication). De plus,dans la rĂ©alitĂ©, il existe au final plusieurs images qui cohabitent en parallĂšle sur le rĂ©seau, chacune propre Ă une communautĂ© et toutes Ă©voluant diffĂ©remment au fil du temps (imaginons comment serait perçu dans chaque camp le rapprochement de deux hommes politiques de bords opposĂ©s). Enfin, en plus des polĂ©miques volontairement provoquĂ©es par le comportement de certaines entitĂ©s en vue dâattirer lâattention sur elles (pensons aux tenues ou dĂ©clarations choquantes), il arrive Ă©galement que la diffusion dâune image dĂ©passe le cadre qui la rĂ©gissait et mĂȘme parfois se retourne contre lâentitĂ© (par exemple, «le mariage pour tous» devenu « la manif pour tous »). Les opinions exprimĂ©es constituent alors autant dâindices permettant de comprendre la logique de construction et dâĂ©volution de ces images. Ce travail dâanalyse est jusquâĂ prĂ©sent confiĂ© Ă des spĂ©cialistes de lâe-communication qui monnaient leur subjectivitĂ©. Ces derniers ne peuvent considĂ©rer quâun volume restreint dâinformation et ne sont que rarement dâaccord entre eux. Dans cette thĂšse, nous proposons dâutiliser diffĂ©rentes mĂ©thodes automatiques, statistiques, supervisĂ©es et dâune faible complexitĂ© permettant dâanalyser et reprĂ©senter lâimage de marque dâentitĂ© Ă partir de contenus textuels les mentionnant. Plus spĂ©cifiquement, nous cherchons Ă identifier les contenus(ainsi que leurs auteurs) qui sont les plus prĂ©judiciables Ă lâimage de marque dâune entitĂ©. Nous introduisons un processus dâoptimisation automatique de ces mĂ©thodes automatiques permettant dâenrichir les donnĂ©es en utilisant un retour de pertinence simulĂ© (sans quâaucune action de la part de lâentitĂ© concernĂ©e ne soit nĂ©cessaire). Nous comparer Ă©galement plusieurs approches de contextualisation de messages courts Ă partir de mĂ©thodes de recherche dâinformation et de rĂ©sumĂ© automatique. Nous tirons Ă©galement parti dâalgorithmes de modĂ©lisation(tels que la RĂ©gression des moindres carrĂ©s partiels), dans le cadre dâune modĂ©lisation conceptuelle de lâimage de marque, pour amĂ©liorer nos systĂšmes automatiques de catĂ©gorisation de documents textuels. Ces mĂ©thodes de modĂ©lisation et notamment les reprĂ©sentations des corrĂ©lations entre les diffĂ©rents concepts que nous manipulons nous permettent de reprĂ©senter dâune part, le contexte thĂ©matique dâune requĂȘte de lâentitĂ© et dâautre, le contexte gĂ©nĂ©ral de son image de marque. Nous expĂ©rimentons lâutilisation et la combinaison de diffĂ©rentes sources dâinformation gĂ©nĂ©rales reprĂ©sentant les grands types dâinformation auxquels nous sommes confrontĂ©s sur internet : de long les contenus objectifs rĂ©digĂ©s Ă des informatives, les contenus brefs gĂ©nĂ©rĂ©s par les utilisateurs visant Ă partager des opinions. Nous Ă©valuons nos approches en utilisant deux collections de donnĂ©es, la premiĂšre est celle constituĂ©e dans le cadre du projet Imagiweb, la seconde est la collection de rĂ©fĂ©rence sur le sujet : CLEFRepLa
Fraudes, violences et autres comportements déviants dans le sport professionnel et olympique : Opportunités et limites des sources ouvertes en ligne comme moyen de renseignement
Les sources ouvertes en ligne sont de plus en plus utilisĂ©es comme outils de renseignement. Cette contribution explore la maniĂšre dont elles peuvent ĂȘtre utilisĂ©es pour Ă©tudier la dĂ©viance dans le sport professionnel et olympique. LâĂ©tude a considĂ©rĂ© les fraudes perpĂ©trĂ©es sur le terrain (le dopage, la manipulation de match et les fraudes Ă lâĂ©ligibilitĂ©) et en dehors (la corruption), les violences sur et en dehors du terrain de jeu (le hooliganisme et le terrorisme), ainsi que les autres comportements prĂ©judiciables commis par les sportifs, que ce soit sur le terrain ou en dehors. Un dispositif de veille en ligne a Ă©tĂ© mis en place pour la rĂ©colte dâarticles publiĂ©s en 2016 en anglais. Des 775 cas qui ont Ă©tĂ© relevĂ©s, les fraudes (surtout les cas de dopage et de manipulations de matchs) comptaient Ă elles seules pour 85 % des cas. Au total,
87 pays sont impliquĂ©s dans cette Ă©tude, bien que certaines sous-rĂ©gions â lâEurope de lâEst (17,4 %), lâAfrique de lâEst (16,1 %), ainsi que lâAustralie et la Nouvelle-ZĂ©lande (10,2 %) â se dĂ©marquent par une concentration plus Ă©levĂ©e de cas. Quant aux patterns temporels, des distributions sont concentrĂ©es surtout aux mois dâaoĂ»t et novembre pour les fraudes, et aux mois de juin et juillet pour les violences. Ces tendances peuvent laisser supposer une saisonnalitĂ© des comportements dĂ©viants. En se concentrant sur les biais liĂ©s au langage et aux types de sources, des recherches plus approfondies sur le sujet pourraient contribuer Ă une surveillance systĂ©matique de la reprĂ©sentation mĂ©diatique de ces phĂ©nomĂšnes dans le monde
Regards croisés sur la veille
La veille et la recherche dâinformations, quâelles soient sur et par le web ou non, sont des pratiques indispensables Ă de nombreux mĂ©tiers : communication, marketing, RH, web... Lâobjectif de ce
livre blanc est dâapporter, modestement, des visions et des mĂ©thodologies variĂ©es sur ces pratiques. Le constat de dĂ©part qui a amenĂ© Ă cet ouvrage est le suivant : la veille tout le monde en parle et en fait (ou presque), alors comment enrichir lâexistant ?
Les multiples apports qui constituent cette pratique et cette profession, quâils proviennent de la documentation, de lâintelligence Ă©conomique ou encore du web, rendent riches les possibilitĂ©s dâanalyse. Nous avons donc pris le parti ici de ne
pas viser lâexhaustivitĂ© (impossible de toute maniĂšre) mais de creuser certains aspects, certaines pratiques liĂ©es : cartographie, mind mapping, innovation, recrutement, qualification des sources... Et ce en faisant appel Ă des spĂ©cialistes de ces domaines et Ă des veilleurs professionnels. Pour ne pas ĂȘtre trop thĂ©orique et surtout ramener la veille Ă ce quâelle est, Ă la fois une compĂ©tence et un mĂ©tier Ă part entiĂšre, cet e-book propose aussi de nombreuses interviews de professionnels. Professionnels dont les activitĂ©s de veille ne sont pas des tĂąches Ă plein temps, mais font partie de leurs activitĂ©s quotidiennes. Et qui Ă©claireront sĂ»rement, nous lâespĂ©rons, sous un angle trĂšs pragmatique
certaines de vos interrogations. LâidĂ©e est de vous fournir une vision large : des trucs et astuces pour mener une veille quotidienne aux pratiques plus avancĂ©es. Ceci afin de montrer que
si la veille est accessible à tous (surtout grùce aux outils web), elle peut aussi révéler certains aspects complexes à ne pas négliger.
En parlant dâoutils, vous remarquerez que lâaccent nâa pas Ă©tĂ© portĂ© sur eux. PlutĂŽt que de faire une longue liste de tutoriaux, il nous a paru plus intĂ©ressant de se focaliser sur les mĂ©thodologies et les bonnes pratiques, la maĂźtrise des outils nâĂ©tant souvent quâun moyen plus quâun objectif Ă atteindre.
Au final, ce livre blanc vise à la fois à élargir votre champ de vision, renforcer vos connaissances sur certains aspects, et vous donner quelques armes pour développer votre propre stratégie de veille.
Cet objectif Ă©tant ambitieux, nous remercions les auteurs et interviewĂ©s pour le temps, lâĂ©nergie et la crĂ©ativitĂ© quâils ont dĂ©veloppĂ© pour lâatteindre. Mais aussi la graphiste Morgane Maillard pour les crĂ©as qui mettent en valeur ce contenu
Découverte et analyse des communautés implicites par une approche sémantique en ligne (l'outil WebTribe)
Avec l essor du Web 2.0 et des technologies collaboratives qui y sont rattachées,le Web est aujourd hui devenu une vaste plate-forme d échanges entre internautes.La majeure partie des sites Web sont actuellement soit dédiés aux interactionssociales de leurs utilisateurs, soit proposent des outils pour développer ces interactions.Nos travaux portent sur la compréhension de ces échanges, ainsi que desstructures communautaires qui en découlent, au moyen d une approche sémantique.Pour répondre aux besoins de compréhension propres aux analystes de siteWeb et autres gestionnaires de communautés, nous analysons ces structures communautairespour en extraire des caractéristiques essentielles comme leurs centresthématiques et contributeurs centraux. Notre analyse sémantique s appuie notammentsur des ontologies légÚres de référence pour définir plusieurs nouvelles métriques,comme la centralité sémantique temporelle et la probabilité de propagationsémantique. Nous employons une approche en ligne afin de suivre l activitéutilisateur en temps réel, au sein de notre outil d analyse communautaire Web-Tribe. Nous avons implémenté et testé nos méthodes sur des données extraites desystÚmes réels de communication sociale sur le WebWith the rise of Web 2.0 and collaborative technologies that are attached to,the Web has now become a broad platform of exchanges between users. The majorityof websites is now dedicated to social interactions of their users, or offerstools to develop these interactions. Our work focuses on the understanding of theseexchanges, as well as emerging community structures arising, through a semanticapproach. To meet the needs of web analysts, we analyze these community structuresto identify their essential characteristics as their thematic centers and centralcontributors. Our semantic analysis is mainly based on reference light ontologiesto define several new metrics such as the temporal semantic centrality and thesemantic propagation probability. We employ an online approach to monitor useractivity in real time in our community analysis tool WebTribe. We have implementedand tested our methods on real data from social communication systemson the WebDIJON-BU Doc.électronique (212319901) / SudocSudocFranceF
Fouille de données de santé
Dans le domaine de la santĂ©, les techniques dâanalyse de donnĂ©es sont de plus en plus populaires et se rĂ©vĂšlent mĂȘme indispensables pour gĂ©rer les gros volumes de donnĂ©es produits pour un patient et par le patient. Deux thĂ©matiques seront abordĂ©es dans cette prĂ©sentation d'HDR.La premiĂšre porte sur la dĂ©finition, la formalisation, lâimplĂ©mentation et la validation de mĂ©thodes dâanalyse permettant de dĂ©crire le contenu de bases de donnĂ©es mĂ©dicales. Je me suis particuliĂšrement intĂ©ressĂ©e aux donnĂ©es sĂ©quentielles. Jâai fait Ă©voluer la classique notion de motif sĂ©quentiel pour y intĂ©grer des composantes contextuelles, spatiales et sur lâordre partiel des Ă©lĂ©ments composant les motifs. Ces nouvelles informations enrichissent la sĂ©mantique initiale de ces motifs.La seconde thĂ©matique se focalise sur lâanalyse des productions et des interactions des patients au travers des mĂ©dias sociaux. Jâai principalement travaillĂ© sur des mĂ©thodes permettant dâanalyser les productions narratives des patients selon leurs temporalitĂ©s, leurs thĂ©matiques, les sentiments associĂ©s ou encore le rĂŽle et la rĂ©putation du locuteur sâĂ©tant exprimĂ© dans les messages
Actes de la conférence Traitement Automatique de la Langue Naturelle, TALN 2018: Volume 2 : Démonstrations, articles des Rencontres Jeunes Chercheurs, ateliers DeFT
International audienc
Etude de l'ambiguĂŻtĂ© des requĂȘtes dans un moteur de recherche spĂ©cialisĂ© dans l'actualitĂ© : exploitation d'indices contextuels
In this thesis, we consider the question of the ambiguity of queries submitted to a search engine in a particular area that is news.We build on recent work in the field of information retrieval (IR) that showed the addition of contextual information to better identify and address more adequately the information need. On this basis, we make the hypothesis that the elements of information available in an application of IR (contexts in the collection of documents, repetitions and reformulations of queries, diachronic dimension of the search) can help us to examine this problem of ambiguity. We also postulate that ambiguity will manifest in the results returned by a search engine. In this purpose to evaluate these hypotheses, we set up a device to study the ambiguity of queries based on a method of thematic categorization of queries, which relies on an expert categorization. We then show that this ambiguity is different which is indicated by an encyclopedic resources such as Wikipedia.We evaluate this categorization device by setting up two user tests. Finally, we carry out a study based on a set of contextual clues in order to understand the global behavior of a query.Dans cette thĂšse, nous envisageons la question de lâambiguĂŻtĂ© des requĂȘtes soumises Ă un moteur de recherche dans un domaine particulier qui est lâactualitĂ©. Nous nous appuyons sur les travaux rĂ©cents dans le domaine de la recherche dâinformation (RI) qui ont montrĂ© lâapport dâinformations contextuelles pour mieux cerner et traiter plus adĂ©quatement le besoin informationnel. Nous faisons ainsi lâhypothĂšse que les Ă©lĂ©ments dâinformation disponibles dans une application de RI (contextes prĂ©sents dans la base documentaire, rĂ©pĂ©titions et reformulations de requĂȘtes, dimension diachronique de la recherche) peuvent nous aider Ă Ă©tudier ce problĂšme dâambiguĂŻtĂ©. Nous faisons Ă©galement lâhypothĂšse que lâambiguĂŻtĂ© va se manifester dans les rĂ©sultats ramenĂ©s par un moteur de recherche. Dans ce but, nous avons mis en place un dispositif pour Ă©tudier lâambiguĂŻtĂ© des requĂȘtes reposant sur une mĂ©thode de catĂ©gorisation thĂ©matique des requĂȘtes, qui sâappuie sur unecatĂ©gorisation experte. Nous avons ensuite montrĂ© que cette ambiguĂŻtĂ© est diffĂ©rente de celle repĂ©rĂ©e par une ressource encyclopĂ©dique telle que WikipĂ©dia. Nous avons Ă©valuĂ© ce dispositif de catĂ©gorisation en mettant en place deux tests utilisateurs. Enfin, nous fournissons une Ă©tude basĂ©e sur un faisceau dâindices contextuels afin de saisir le comportement global dâune requĂȘte
La réalité augmentée en médiathÚque: une aide à la valorisation des collections ? : réflexion autour d'une application mobile de réalité augmentée pour la MédiathÚque Valais-Sion
La rĂ©alitĂ© augmentĂ©e est une technologie Ă©mergente qui intrigue et surprend. Parfois considĂ©rĂ©e comme un gadget numĂ©rique, un effet de mode qui finira par sâestomper avec le temps, parfois dĂ©finie comme une technologie ambitieuse capable de rĂ©volutionner notre rapport au numĂ©rique, elle peine encore Ă faire lâunanimitĂ© auprĂšs des professionnels de lâinformation. Et pour cause, il nâexiste Ă ce jour que peu dâexemples concrets dâutilisations des technologies de rĂ©alitĂ© augmentĂ©e liĂ©s au domaine des bibliothĂšques sur lesquels les professionnels peuvent sâappuyer. Afin de clarifier la situation de la rĂ©alitĂ© augmentĂ©e et permettre aux bibliothĂ©caires de de mieux envisager son utilisation dans un milieu bibliothĂ©conomique, il sera question, dans ce travail, de proposer une vue dâensemble de cette technologie ; ainsi, plusieurs Ă©lĂ©ments essentiels Ă la bonne comprĂ©hension de la rĂ©alitĂ© augmentĂ©e seront prĂ©sentĂ©s, comme son historique, son fonctionnement, son marchĂ© et les diffĂ©rents domaines et projets qui la concernent. Une fois cette premiĂšre base Ă©tablie, une rĂ©flexion quant Ă lâutilisation de la rĂ©alitĂ© augmentĂ©e dans le cadre dâune problĂ©matique de valorisation des collections sera proposĂ©e. Une rĂ©flexion qui permettra dâaborder, non seulement la MĂ©diathĂšque Valais et son contexte, mais aussi les points essentiels, prĂ©alables et techniques Ă prendre en compte lors de la rĂ©alisation dâune technologie de rĂ©alitĂ© augmentĂ©e en bibliothĂšque ou mĂ©diathĂšque. Tout ceci, afin de permettre, Ă la MĂ©diathĂšque Valais-Sion et aux professionnels intĂ©ressĂ©s, une meilleure appropriation de la technologie. Enfin, sur la base des diffĂ©rents Ă©lĂ©ments Ă©voquĂ©s dans ce travail, sera proposĂ©e une sĂ©lection de fonctionnalitĂ©s rĂ©alistes mettant en scĂšne la rĂ©alitĂ© augmentĂ©e que la MĂ©diathĂšque Valais-Sion pourrait mettre en place
Analyse de publications sociomédiatiques portant sur la nutrition en temps de COVID-19
Les mĂ©dias sociaux sont de plus en plus consultĂ©s afin d'obtenir de l'information relative Ă la santĂ©. NĂ©anmoins, aux cĂŽtĂ©s de l'information juste et fiable y circulent des messages trompeurs ou faux. ParallĂšlement, depuis son Ă©mergence, la pandĂ©mie de COVID-19 a Ă©tĂ© un sujet de discussion notable en ligne comme hors ligne. Plus particuliĂšrement, les liens entre la nutrition et la COVID-19 ont Ă©tĂ© abordĂ©s sur les mĂ©dias sociaux, dont Twitter, tant par des professionnels de la santĂ© que le public. Ces nombreux liens reprĂ©sentent d'ailleurs un domaine d'intĂ©rĂȘt en recherche. Ainsi, l'objectif principal de ce projet est de comparer le comportement de publication quant Ă la nutrition et la COVID-19 de diĂ©tĂ©tistes et du public d'abonnĂ©s Twitter en analysant leurs tweets Ă cet effet selon leurs thĂšmes et l'engagement reçu des lecteurs. Des objectifs secondaires ont Ă©tĂ© Ă©tablis, dont comparer la justesse du contenu des tweets entre les groupes et dĂ©terminer si les tweets de ces derniers ont le potentiel d'influencer le comportement. Les principaux rĂ©sultats indiquent qu'il existe plusieurs diffĂ©rences entre les groupes quant aux thĂšmes qu'ils abordent, aux formes d'engagement qu'ils reçoivent des usagers et aux domaines de changement de comportement qu'ils utilisent. Enfin, les publications des diĂ©tĂ©tistes sont gĂ©nĂ©ralement plus justes que ceux du public. Ces travaux de recherche contribuent Ă encourager la discussion quant au rĂŽle des diĂ©tĂ©tistes sur les mĂ©dias sociaux et Ă informer le dĂ©veloppement d'interventions sociomĂ©diatiques en temps opportun lors de crises sanitaires et ce, afin de contrer la mĂ©sinformation et la
désinformation.Social media are being more and more consulted as sources of health-related information. However, on these platforms, accurate and reliable information is coexisting with misleading and false messages. In parallel, since its emergence, the COVID-19 pandemic has been a notable subject of discussion, online and offline. More specifically, the links between nutrition and COVID-19 have been addressed on social media, including Twitter, by health professionals and the public alike. Besides, these numerous links represent a field of interest in research. Hence, the main objective of this project is to compare the publication behavior related to nutrition and COVID-19 of dietitians and the public of Twitter users by analyzing their tweets to this regard in terms of their themes and the engagement they received from users. Secondary objectives have been established, including comparing the tweets' content accuracy between groups, and determining whether their tweets have the potential to influence behavior. Main results indicate that many differences exist between groups with regards to the themes they discuss, the forms of user engagement they receive, and the behavior change domains they use. Lastly, dietitians' posts are generally more accurate than the public's. This master's thesis contributes to further the discussion on the dietitians' role on social media and to inform the development of timely interventions on such platforms during health crises to counter misinformation and disinformation
- âŠ