1,144 research outputs found

    Diversité et recommandation : une investigation sur l’apport de la fouille d’opinions pour la distinction d’articles d’opinion dans une controverse médiatique

    Full text link
    Les plateformes de consultation d’articles de presse en format numérique comme Google Actualités et Yahoo! Actualités sont devenues de plus en plus populaires pour la recherche et la lecture de l’information journalistique en ligne. Dans le but d’aider les usagers à s’orienter parmi la multitude de sources d’information, ces plateformes intègrent à leurs moteurs de recherche des mécanismes de filtrage automatisés, connus comme systèmes de recommandation. Ceux-ci aident les usagers à retrouver des ressources informationnelles qui correspondent davantage à leurs intérêts et goûts personnels, en prenant comme base des comportements antérieurs, par exemple, l’historique de documents consultés. Cependant, ces systèmes peuvent nuire à la diversité d’idées et de perspectives politiques dans l’environnement informationnel qu’ils créent : la génération de résultats de recherche ou de recommandations excessivement spécialisées, surtout dans le contexte de la presse en ligne, pourrait cacher des idées qui sont importantes dans un débat. Quand l’environnement informationnel est insuffisamment divers, il y a un manque d’opportunité pour produire l’enquête ouverte, le dialogique et le désaccord constructif, ce qui peut résulter dans l’émergence d’opinions extrémistes et la dégradation générale du débat. Les travaux du domaine de l’intelligence artificielle qui tentent de répondre au problème de la diversité dans les systèmes de recommandation d’articles de presse sont confrontés par plusieurs questions, dont la représentation de textes numériques dans le modèle vectoriel à partir d’un ensemble de mots statistiquement discriminants dans ces textes, ainsi que le développement d’une mesure statistique capable de maximiser la différence entre des articles similaires qui sont retournés lors d’un processus de recommandation à un usager. Un courant de recherche propose des systèmes de recommandation basés sur des techniques de fouille d’opinions afin de détecter de manière automatique la différence d’opinions entre des articles de presse qui traitent d’un même thème lors du processus de recommandation. Dans cette approche, la représentation des textes numériques se fait par un ensemble de mots qui peuvent être associés, dans les textes, à l’expression d’opinions, comme les adjectifs et les émotions. Néanmoins, ces techniques s’avèrent moins efficaces pour détecter les différences entre les opinions relatives à un débat public argumenté, puisque l’expression de l’opinion dans les discussions politiques n’est pas nécessairement liée à l’expression de la subjectivité ou des émotions du journaliste. Notre recherche doctorale s’inscrit dans l’objectif de (1) systématiser et de valider une méthodologie de fouille d’opinions permettant d’assister l’identification d’opinions divergentes dans le cadre d’une controverse et (2) d’explorer l’applicabilité de cette méthodologie pour un système de recommandation d’articles de presse. Nous assimilons la controverse à un type de débat d’opinions dans la presse, dont la particularité est la formation de camps explicitement opposés quant à la façon de voir et de comprendre une question d’importance pour la collectivité. Notre recherche apporte des questionnements sur la définition d’opinion dans ce contexte précis et discute la pertinence d’exploiter les théories discursives et énonciatives dans les recherches de fouille d’opinions. Le corpus expérimental est composé par 495 articles d’opinion publiés dans la presse au sujet de la mobilisation étudiante du Québec en 2012 contre la hausse de droits de scolarité annoncée par le gouvernement de Jean Charest. Ils ont été classés dans deux catégories, ETUD et GOUV, en fonction du type d’opinion qu’ils véhiculent. Soit ils sont favorables aux étudiants et à la continuité de la grève soit favorables au gouvernement et critiques envers le mouvement de grève. Sur le plan méthodologique, notre recherche se base sur la démarche proposée par les travaux qui explorent des techniques du champ de la linguistique du corpus dans la fouille d’opinions, ainsi que les concepts de la sémantique interprétative de François Rastier. Elle systématise les étapes de cette démarche, en préconisant la description des textes du corpus, pour relever et interpréter les mots spécifiques qui contrastent les types d’opinions qui devront être classés. Ce travail permet de sélectionner des critères textuels interprétables et descriptifs des phénomènes énonciatifs étudiés dans le corpus qui serviront à représenter les textes numériques dans le format vectoriel. La démarche proposée par ces travaux a été validée avec l’utilisation du corpus de presse constitué pour l’expérimentation. Les résultats démontrent que la sélection de 447 critères textuels par une approche interprétative du corpus est plus performante pour la classification automatique des articles que le choix d’un ensemble de mots dont la sélection ne prend pas en compte de facteurs linguistiques liés au corpus. Notre recherche a également évalué la possibilité d’une application dans les systèmes de recommandation d’articles de presse, en faisant une étude sur l’évolution chronologique du vocabulaire du corpus de l’expérimentation. Nous démontrons que la sélection de critères textuels effectuée au début de la controverse est efficace pour prédire l’opinion des articles qui sont publiés par la suite, suggérant que la démarche de sélection de critères interprétables peut être mise au profit d’un système de recommandation qui propose des articles d’opinion issus d’une controverse médiatique.Web-based reading services such as Google News and Yahoo! News have become increasingly popular with the growth of online news consumption. To help users cope with information overload on these search engines, recommender systems and personalization techniques are utilized. These services help users find content that matches their personal interests and tastes, using their browser history and past behavior as a basis for recommendations. However, recommender systems can limit diversity of thought and the range of political perspectives that circulate within the informational environment. In consequence, relevant ideas and questions may not be seen, debatable assumptions may be taken as facts, and overspecialized recommendations may reinforce confirmation bias, special interests, tribalism, and extremist opinions. When the informational environment is insufficiently diverse, there is a loss of open inquiry, dialogue and constructive disagreement—and, as a result, an overall degradation of public discourse. Studies within the artificial intelligence field that try to solve the diversity problem for news recommender systems are confronted by many questions, including the vector model representation of digital texts and the development of a statistical measure that maximizes the difference between similar articles that are proposed to the user by the recommendation process. Studies based on opinion mining techniques propose to tackle the diversity problem in a different manner, by automatically detecting the difference of perspectives between news articles that are related by content in the recommendation process. In this latter approach, the representation of digital texts in the vector model considers a set of words that are associated with opinion expressions, such as adjectives or emotions. However, those techniques are less effective in detecting differences of opinion in a publicly argued debate, because journalistic opinions are not necessarily linked with the journalist’s subjectivity or emotions. The aims of our research are (1) to systematize and validate an opinion mining method that can classify divergent opinions within a controversial debate in the press and (2) to explore the applicability of this method in a news recommender system. We equate controversy to an opinion debate in the press where at least two camps are explicitly opposed in their understanding of a consequential question in their community. Our research raises questions about how to define opinion in this context and discusses the relevance of using discursive and enunciation theoretical approaches in opinion mining. The corpus of our experiment has 495 opinion articles about the 2012 student protest in Quebec against the raise of tuition fees announced by the Liberal Premier Minister Jean Charest. Articles were classified into two categories, ETUD and GOUV, representing the two types of opinions that dominated the debate: namely, those that favored the students and the continuation of the strike or those that favored the government and criticized the student movement. Methodologically, our research is based on the approach of previous studies that explore techniques from the corpus linguistics field in the context of opinion mining, as well as theoretical concepts of François Rastier’s Interpretative Semantics. Our research systematizes the steps of this approach, advocating for a contrastive and interpretative description of the corpus, with the aim of discovering linguistic features that better describe the types of opinion that are to be classified. This approach allows us to select textual features that are interpretable and compatible with the enunciative phenomena in the corpus that are then used to represent the digital texts in the vector model. The approach of previous works has been validated by our analysis of the corpus. The results show that the selection of 447 textual features by an interpretative approach of the corpus performs better for the automatic classification of the opinion articles than a selection process in which the set of words are not identified by linguistic factors. Our research also evaluated the possibility of applying this approach to the development of a news recommender system, by studying the chronological evolution of the vocabulary in the corpus. We show that the selection of features at the beginning of the controversy effectively predicts the opinion of the articles that are published later, suggesting that the selection of interpretable features can benefit the development of a news recommender system in a controversial debate

    Éducation et numérique, Défis et enjeux

    Get PDF
    International audienceCe document est le fruit d’un travail collectif qui a pour ambition d’analyser l’impact du numérique comme vecteur de transformation éducative, d’une part par la nécessité de la formation à la pensée computationnelle dans un monde devenu numérique et d’autre part par l’usage croissant des outils numériques. L’objectif était de présenter les défis et les enjeux notamment de souveraineté numérique et de respect de la vie privée, d’identifier des questions de recherche pour les sciences du numérique et de faire quelques recommandations. La crise liée à la pandémie de Covid-19 est survenue au moment de la finalisation de sa rédaction et bien entendu, nous nous sommes interrogés sur notre projet. Était-il toujours d’actualité ? Le contenu était-il toujours pertinent ? Quels ont été les usages et les limites du numérique pour soutenir la continuité pédagogique pendant la crise ? De nouvelles questions de recherche sont-elles posées ? Autant d’interrogations qui nous ont conduits à un travail supplémentaire de réflexion.Les livres blancs d'Inria examinent les grands défis actuels posés par le numérique et présentent les actions menées par nos équipes-projets pour les résoudre. Ils ont pour objectif de faire le point sur une problématique en précisant ses complexités, en détaillant les voies de recherches existantes ou en émergence et en décrivant les impacts sociétaux attendus et à prévoir

    Vers une approche web sémantique dans les applications de gestion de conférences

    Get PDF
    Depuis sa création, il y a plusieurs années, par Tim Berners-Lee, le World Wide Web a révolutionné considérablement plusieurs domaines, notamment la société, l'économie et surtout la recherche et la manière dont celle-ci est conduite. Cependant, la majeure partie du Contenu du Web actuel a été conçue pour être lue et comprise par les êtres humains. Les applications et les agents logiciels n'avaient alors aucunes idées sur son sens réel. Le web sémantique, comme extension du Web actuel, vise à structurer son sens et permettre une meilleure collaboration homme-machine. On s'ouvre ainsi à de nouvelles possibilités d'automatisation sur le web et une gestion plus intelligente du contenu. Dans cette optique, plusieurs technologies clés comme XML, RDF et OWL ont été développées, puis standardisées par le World Wide Web Consortium (W3C). Nous nous proposons d'étudier, dans le cadre de notre projet de maîtrise, l'approche Web sémantique dans les applications de gestion de conférences. Le projet SWOC (Semantic Web Open Conference) fait partie de cette réflexion. Il s'agit d'effectuer la ré-ingénierie d'une application en ligne de gestion des conférences, dans le but de la faire migrer vers la technologie du Web sémantique. Les ateliers de travail et les séminaires constituent, en effet, un partage de connaissances et d'idées entre des personnes d'une même communauté intellectuelle. Mettre leur gestion au c?ur des innovations technologiques doit tenir compte de nombreuses contraintes. Or, au cours de notre recherche, nous avons relevé plusieurs limites dans les applications en ligne les plus utilisées, liées principalement à l'assignation des articles aux évaluateurs, l'aide à la saisie des données et la description des ressources. L'idée qui se profile derrière ce projet est de cerner les plus-values du nouveau système et à en dégager les résultats d'assignation, afin de les comparer à ceux d'un système de base. Ce travail de recherche vise ainsi à analyser de plus près l'approche Web sémantique et son apport dans les applications de gestion de conférences, et d'en tirer des conclusions

    Autorégulation épistémique des systèmes sociaux de production de connaissance: le cas de la Banque du Canada

    Get PDF
    La littérature actuelle en philosophie de l’expertise accorde une plus grande attention aux aspects individuels du phénomène qu’à ses aspects sociaux. Le résultat est de rendre insatisfaisantes les méthodes dont dispose une personne profane afin évaluer le niveau de confiance à accorder à des regroupements d’experts (organisations expertes, centres de recherche nationaux, agences de financement, etc.). Le mémoire propose une ébauche de cadre conceptuel permettant d'évaluer rationnellement la confiance que l'on devrait accorder à de telles entités, appelées « systèmes socioépistémiques ». Il est suggéré d’utiliser la capacité d’un système social à contrôler et à corriger les croyances fausses tenues par ses membres, ou « autorégulation épistémique ». Au plan normatif, cette capacité générale se traduit par certaines caractéristiques bénéfiques qui devraient être retrouvées au sein d’un système socioépistémique. Ces caractéristiques sont intégrées au cadre conceptuel à partir de travaux en philosophie, en sociologie et en histoire des sciences. Afin de tester le cadre conceptuel « sur le terrain » et valider son utilité en pratique, il a été choisi de focaliser sur le cas de la Banque du Canada, l'organisation experte qui régule la politique monétaire au pays. Au plan empirique, une grille d’analyse a donc été développée pour opérationnaliser le cadre conceptuel, c’est-à-dire cumuler des observations concernant les pratiques épistémiques au sein de la Banque du Canada. Pour combler le besoin informationnel relatif à cette grille d’analyse, un corpus de documents officiels issus de la Banque du Canada a été moissonné du web, et des techniques de forage de textes ont été appliquées afin d’en extraire les documents pertinents. Bien qu’il faille, pour appuyer les conclusions tirées dans le mémoire, effectuer davantage de recherche avec des méthodes complémentaires, on peut avancer que des tensions semblent exister quant à la préservation de l’équilibre des intérêts cognitifs au sein du système. Celles-ci sont accentuées par des tendances de pilotage de la recherche visant la réalisation d’un agenda « officiel » de recherche pour l’organisation. Au final, bonifier progressivement le cadre conceptuel de l’autorégulation épistémique pourrait permettre d’en faire un guide pratique à l’évaluation, par procuration, du niveau de confiance à accorder à un regroupement expert

    Aide au processus décisionnel pour la gestion par bassin versant au Québec : étude de cas et principaux enjeux

    Get PDF
    Les conditions particulières prévalant lors de l’application d’une approche de gestion par bassin versant au Québec (Canada) font appel à de nouvelles méthodologies intégrées pour faciliter l’analyse et le partage des informations, les conditions de négociation entre les parties prenantes et la mise en oeuvre des choix d’aménagement ou de gestion retenus. Cet article met en perspective la modélisation des processus décisionnels territoriaux à l’échelle des bassins versants (BV). Il dégage certains enjeux méthodologiques se rattachant à cette problématique de gestion dans sa dimension informationnelle, dans le contexte du Québec. Il montre l’interconnexion des préoccupations décisionnelles aux conditions d’utilisation d’une plate-forme géomatique à même de modéliser de tels processus territoriaux dans le cadre d’un système intégré d’aide à la décision (SIAD). Finalement, il recommande l’évaluation de l’utilisation d’un tel système (SIAD-BV) pour faciliter l’émergence des conditions d’application de l’approche de la gestion intégrée par bassin versant au Québec, à partir des discussions réalisées avec des intervenants des bassins Chaudière et Outaouais.The unique conditions that prevail when a political approach to watershed management in Quebec (Canada) is taken, requires a need for integrated methodologies to promote the following: information sharing and analysis, negotiation of conditions among stakeholders and introduction of selected management alternatives. This article brings the modelling of regional decision-making processes that apply to watershed management (WM) into perspective. It discusses the methodological challenges relating to information that are inherent to this management issue, particularly in a Québec (Canada) context. It shows links between decisional concerns and geomatic skills for modelling these regional processes, as an integrated decision support system (IDSS). Lastly, it recommends assessing the use of this type of system to promote the emergence of conditions where such an approach to watershed management in Québec could be implemented, based on interviews conducted with regional professionals in the Chaudière and Outaouais basins

    Les technologies de la parole et du TALN pour l'assistance à domicile des personnes âgées : un rapide tour d'horizon (Quick tour of NLP and speech technologies for ambient assisted living) [in French]

    No full text
    National audiencePour relever le défi du maintien à domicile de la population vieillissante, une des solutions retenues par les pays industrialisés est le développement massif des Technologies de l'Information et de la Communication (TIC). Les TIC représentent une opportunité importante pour améliorer la vie quotidienne des personnes âgées afin qu'elles soient toujours maitresses de leurs choix et qu'elles utilisent la technologie pour continuer à vivre de manière autonome, à apprendre et à s'investir dans la vie sociale. Les technologies du traitement du langage naturelle et de la parole qui se trouvent au cœur de la communication humaine, ont donc un rôle significatif à jouer. Dans cet article nous dressons un tour d'horizon des technologies du TALN et du traitement de la parole actuellement développées dans ce cadre et des verrous ou écueils techniques ou éthiques qui peuvent limiter leur impact

    Actes des 29es Journées Francophones d'Ingénierie des Connaissances, IC 2018

    Get PDF
    International audienc

    Organisations et territoires

    Get PDF
    La gouvernance, science de l’imprécis - Gilles Paquet La confiance vigilante : les instruments de la saine gouvernance - Jeanne Simard et Marc-André Morency La confiance dans les relations interentreprises : antécédents, retombées, mesures et découvertes récentes - Marc-Antoine Vachon et Lova Rajaobelina Gouvernance des territoires ville-port : empreintes locales, concurrences régionales et enjeux globaux - Brigitte Daudet et Yann Alix Le soutien aux travailleurs autonomes : constats issus de deux collectes de données séparées par une période de 10 ans - Sylvie Laferté L’entrepreneuriat autrement : Portrait des Coopératives d’activités et d’emplois françaises - Mathieu Vigneault Les facteurs explicatifs de l’engagement environnemental des PME dans le secteur de l’agroalimentaire : une étude comparative Canada-France-Finlande - Yves Robichaud, Corinna Stocky, Nicolas Legrand et Caroline Godard Le contre-cycle économique au Saguenay-Lac-St-Jean : Radioscopie comparative : Larouche vs Proulx - Sylvain Larouch

    Rapport sur la numérisation du patrimoine écrit

    Get PDF
    Remis par Marc Tessier au Ministre de la culture et de la communication et portant sur la numérisation des fonds patrimoniaux des bibliothèques
    • …
    corecore