Search CORE

9 research outputs found

Analyse morphologique non supervisée en domaine biomédical. Application à la recherche d'information

Author: Claveau Vincent
Kijak Ewa
Publication venue: ATALA (Association pour le Traitement Automatique des Langues)
Publication date: 08/10/2013
Field of study

International audienceDans le domaine biomédical, utiliser des termes spécialisés est essentiel pour accéder à l'information. Cependant, dans beaucoup de langues, ces termes sont des constructions morphologiques complexes qui compliquent cet accès à l'information. Dans cet article, nous nous intéressons à l'identiﬁcation des composants morphologiques de ces termes et à leur utilisation pour une tâche de recherche d'information (RI). Nous proposons différentes approches reposant sur un alignement automatique avec une langue pivot particulière, le japonais, et sur un apprentissage par analogie permettant de produire des analyses morphologiques ﬁnes des termes d'une langue donnée. Ces analyses morphologiques sont ensuite utilisées pour améliorer l'indexation de documents biomédicaux. Les expériences rapportées montrent la validité de cette approche avec des gains en MAP de plus de 10 % par rapport à un système de RI standard

HAL-CentraleSupelec

INRIA a CCSD electronic archive server

HAL-Rennes 1

Contribution à l’amélioration de la recherche d’information par utilisation des méthodes sémantiques: application à la langue arabe

Author: Mazari Ahmed Cherif,
Publication venue
Publication date: 15/07/2022
Field of study

Un système de recherche d’information est un ensemble de programmes et de modules qui sert à interfacer avec l’utilisateur, pour prendre et interpréter une requête, faire la recherche dans l’index et retourner un classement des documents sélectionnés à cet utilisateur. Cependant le plus grand challenge de ce système est qu’il doit faire face au grand volume d’informations multi modales et multilingues disponibles via les bases documentaires ou le web pour trouver celles qui correspondent au mieux aux besoins des utilisateurs. A travers ce travail, nous avons présenté deux contributions. Dans la première nous avons proposé une nouvelle approche pour la reformulation des requêtes dans le contexte de la recherche d’information en arabe. Le principe est donc de représenter la requête par un arbre sémantique pondéré pour mieux identifier le besoin d'information de l'utilisateur, dont les nœuds représentent les concepts (synsets) reliés par des relations sémantiques. La construction de cet arbre est réalisée par la méthode de la Pseudo-Réinjection de la Pertinence combinée à la ressource sémantique du WordNet Arabe. Les résultats expérimentaux montrent une bonne amélioration dans les performances du système de recherche d’information. Dans la deuxième contribution, nous avons aussi proposé une nouvelle approche pour la construction d’une collection de test de recherche d’information arabe. L'approche repose sur la combinaison de la méthode de la stratégie de Pooling utilisant les moteurs de recherches et l’algorithme Naïve-Bayes de classification par l’apprentissage automatique. Pour l’expérimentation nous avons créé une nouvelle collection de test composée d’une base documentaire de 632 documents et de 165 requêtes avec leurs jugements de pertinence sous plusieurs topics. L’expérimentation a également montré l’efficacité du classificateur Bayésien pour la récupération de pertinences des documents, encore plus, il a réalisé des bonnes performances après l’enrichissement sémantique de la base documentaire par le modèle word2vec

University of Biskra Theses Repository

Contribution à la construction d’ontologies et à la recherche d’information : application au domaine médical

Author: Drame Khadim
Publication venue: HAL CCSD
Publication date: 10/12/2014
Field of study

This work aims at providing efficient access to relevant information among the increasing volume of digital data. Towards this end, we studied the benefit from using ontology to support an information retrieval (IR) system.We first described a methodology for constructing ontologies. Thus, we proposed a mixed method which combines natural language processing techniques for extracting knowledge from text and the reuse of existing semantic resources for the conceptualization step. We have also developed a method for aligning terms in English and French in order to enrich terminologically the resulting ontology. The application of our methodology resulted in a bilingual ontology dedicated to Alzheimer’s disease.We then proposed algorithms for supporting ontology-based semantic IR. Thus, we used concepts from ontology for describing documents automatically and for query reformulation. We were particularly interested in: 1) the extraction of concepts from texts, 2) the disambiguation of terms, 3) the vectorial weighting schema adapted to concepts and 4) query expansion. These algorithms have been used to implement a semantic portal about Alzheimer’s disease. Further, because the content of documents are not always fully available, we exploited incomplete information for identifying the concepts, which are relevant for indexing the whole content of documents. Toward this end, we have proposed two classification methods: the first is based on the k nearest neighbors’ algorithm and the second on the explicit semantic analysis. The two methods have been evaluated on large standard collections of biomedical documents within an international challenge.Ce travail vise à permettre un accès efficace à des informations pertinentes malgré le volume croissant des données disponibles au format électronique. Pour cela, nous avons étudié l’apport d’une ontologie au sein d’un système de recherche d'information (RI).Nous avons tout d’abord décrit une méthodologie de construction d’ontologies. Ainsi, nous avons proposé une méthode mixte combinant des techniques de traitement automatique des langues pour extraire des connaissances à partir de textes et la réutilisation de ressources sémantiques existantes pour l’étape de conceptualisation. Nous avons par ailleurs développé une méthode d’alignement de termes français-anglais pour l’enrichissement terminologique de l’ontologie. L’application de notre méthodologie a permis de créer une ontologie bilingue de la maladie d’Alzheimer.Ensuite, nous avons élaboré des algorithmes pour supporter la RI sémantique guidée par une ontologie. Les concepts issus d’une ontologie ont été utilisés pour décrire automatiquement les documents mais aussi pour reformuler les requêtes. Nous nous sommes intéressés à : 1) l’identification de concepts représentatifs dans des corpus, 2) leur désambiguïsation, 3), leur pondération selon le modèle vectoriel, adapté aux concepts et 4) l’expansion de requêtes. Ces propositions ont permis de mettre en œuvre un portail de RI sémantique dédié à la maladie d’Alzheimer. Par ailleurs, le contenu des documents à indexer n’étant pas toujours accessible dans leur ensemble, nous avons exploité des informations incomplètes pour déterminer les concepts pertinents permettant malgré tout de décrire les documents. Pour cela, nous avons proposé deux méthodes de classification de documents issus d’un large corpus, l’une basée sur l’algorithme des k plus proches voisins et l’autre sur l’analyse sémantique explicite. Ces méthodes ont été évaluées sur de larges collections de documents biomédicaux fournies lors d’un challenge international

Thèses en Ligne

Analyse comparative de la terminologie des médias sociaux : contribution des domaines de la communication et de l'informatique à la néologie

Author: Charlebois Julien-Claude
Publication venue
Publication date: 01/08/2019
Field of study

L’objectif de cette étude est de repérer des néologismes à partir de corpus de textes français au moyen d’une méthode semi-automatique. Plus précisément, nous extrayons les néologismes de corpus associés à deux domaines différents, mais traitant du même thème, nous examinons leur répartition et nous les classons selon leur type. L’étude s’appuie sur l’analyse de corpus traitant des médias sociaux. Le premier aborde les médias sociaux du point de vue de la communication, l’autre le fait du point de vue de l’informatique. Ces points de vue ont été privilégiés, car la communication considère ce qui a trait l’utilisation des médias sociaux et l’informatique aborde leur cartographie. La méthode fait appel à l’extracteur de termes TermoStat pour recenser la terminologie des médias sociaux pour chaque point de vue. Ensuite, nous soumettons les 150 termes les plus spécifiques de chaque point de vue à une méthode de validation divisée en trois tests destinés à valider leur statut néologique : des dictionnaires spécialisés, des dictionnaires de langue générale et un outil de visualisation de n-grammes. Finalement, nous étiquetons les néologismes selon la typologie de Dubuc (2002). L’analyse des résultats de la communication et de l’informatique est comparative. La comparaison des deux corpus révèle les contributions respectives de la communication et de l'informatique à la terminologie des médias sociaux en plus de montrer les termes communs aux deux disciplines. L’étude a également permis de repérer 60 néologismes, dont 28 sont exclusifs au corpus de la communication, 28 exclusifs à celui de l’informatique et 4 communs aux deux corpus. La recherche révèle également que les composés par subordination sont les types de néologismes les plus présents dans nos résultats.The objective of this study is to identify the neologisms within corpora of French texts by means of a semi-automatic method. More precisely, we will extract the neologisms from corpora associated to two different areas; however dealing with the same topic, we examine their distribution and we classify them according to their type. This study is based on an analysis of two corpora within social media. The first one approaches social media from the point of view of communication, and the other approaches it from the point of view of computer science. We prioritize these two points of view being that communication is used as the main source of social media’s utilization and that computer science allows us to understand what is involved to allow for social media to be functional. For this method, we use the TermoStat term extractor in order to take census of terminology for each point of view. We then submit 150 of the most specific terms related to each point of view by way of an exclusion corpus from which we divide into three different tests meant to validate their neological status: specialized dictionaries, general language dictionaries, and a visualization tool for n-grams. Lastly, we label the neologisms according to Dubuc’s (2002) typology. The analysis of the results obtained for communication and computer science uses a comparative method. The comparison of the two corpora reveals the respective contributions from communication and computer science with respect to the terminology of social medias, as well it demonstrates common terms found within the two disciplines. This examination also allowed for the identification of 60 neologisms; of which 28 are exclusive to the corpus of communication, another 28 are exclusive to that of computer science, and four were found to be common to both corpora. This research also reveals that subordinate compounds are the most present types of neologisms according to our results

Dépôt Institutionnel Numérique

Actes de la 6e conférence conjointe Journées d'Études sur la Parole (JEP, 33e édition), Traitement Automatique des Langues Naturelles (TALN, 27e édition), Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RÉCITAL, 22e édition. Volume 2 : Traitement Automatique des Langues Naturelles

Author: Benzitoun Christophe
Braud Chloé
Huber Laurine
Langlois David
Ouni Slim
Pogodalla Sylvain
Schneider Stéphane
Publication venue: AFCP
Publication date: 01/01/2020
Field of study

@ 6ème conférence conjointe: JEP-TALN-RECITAL 2020no abstrac

INRIA a CCSD electronic archive server

Actes de la conférence Traitement Automatique de la Langue Naturelle, TALN 2018: Volume 2 : Démonstrations, articles des Rencontres Jeunes Chercheurs, ateliers DeFT

Author: Cellier Peggy
Claveau Vincent
Grouin Cyril
Ligozat Anne-Laure
Minard Anne-Lyse
Paroubek Patrick
Publication venue: HAL CCSD
Publication date: 14/05/2018
Field of study

International audienc

INRIA a CCSD electronic archive server

Dans quelle mesure les déficits neuropsychologiques sont-ils liés au fonctionnement social des personnes atteintes de schizophrénie ou de psychose apparentée à la schizophrénie?

Author: Lehoux Catherine
Publication venue: Bibliotheque de l' Universite Laval
Publication date: 01/01/2006
Field of study

CorpusUL

La communauté professionnelle du secteur de l’intelligence artificielle à Montréal

Author: Houdelinckx Alizé
Publication venue
Publication date: 01/08/2021
Field of study

Cette thèse a pour objet les liens sociaux entre les travailleurs du secteur de l’intelligence artificielle (IA) à Montréal, métropole qui connaît depuis les années 2010 un engouement social, économique, politique et médiatique pour ce secteur peu touché par la crise et par l’instabilité en emploi. Les travailleurs de l’IA occupent des emplois aux savoirs et aux savoir-faire hétérogènes et collaborent directement et indirectement pour construire collectivement les passerelles entre la science et la technologie. Au croisement de la sociologie des professions et de la sociologie du lien social, cette recherche interroge les caractéristiques des liens entre ces travailleurs mais aussi l’organisation symbolique dans laquelle ils sont intégrés. Elle mobilise le concept de communauté professionnelle pour désigner d’une part les travailleurs de l’IA dans leur ensemble, et d’autre part, ce pouvoir moral qui unit leurs intérêts individuels autant qu’il les dépasse. En étudiant leurs modes d’intégration, d’engagement dans l’activité, de reconnaissance et de protection, il ressort que l’intérêt partagé pour l’intelligence artificielle et la satisfaction de participer à « l’essor » de son secteur d’activité caractérisent significativement les liens qui les unissent. La popularité politique et économique du label « IA » renforce le prestige des travailleurs, qui doivent en retour continuer de renforcer sa légitimité dans l’espace social. Construites sur une approche mixte, les analyses révèlent en effet que ces liens entrainent des formes de dépendance et des rapports de pouvoir symbolique entre les professionnels et les travailleurs de métier qui composent la communauté professionnelle de l’IA.This dissertation investigates the social bonds between workers in the artificial intelligence (AI) industry in Montreal. Through the 2010s, this city has manifested a growing social, economic, political and media interest for this sector still rather sheltered from the crisis and job instability. AI workers occupy jobs requiring a variety of knowledge and skills and collaborate both directly and indirectly to build collectively the bridges between science and technology. At the intersection of the sociology of professions and Durkheim’s sociology of the social bond, this dissertation examines the ties that characterize these workers relationships but also the symbolic structure in which they are integrated. I use the concept of professional community to designate, on the one hand, AI workers as a whole, and on the other hand, this moral force that unites their individual interests as much as it transcends them. Through an analysis of their modes of integration, commitment to the activity, recognition, and protection, I argue that the bonds that unite the AI workers are characterized by a shared interest in artificial intelligence and the satisfaction of participating in the AI “boom”. The political and economical popularity of the “AI” label reinforces the prestige of the workers, who in return must continue to strengthen the legitimacy of the sector in the public sphere. Built on a mixed approach, the analyses presented in this dissertation show that these bonds lead to dependencies and symbolic power relationships between the professionals and the workers in the AI professional community

Dépôt Institutionnel Numérique

Art et mal-voyance à l'épreuve : un paradoxe fertile

Author: Sanzay-Langlais Julie,
Publication venue: HAL CCSD
Publication date: 19/06/2015
Field of study

This dissertation focuses on the link between the human visual system – examined from a scientific point of view – and the personal plastic expression relating facilities and photographs which deal with visual impairment. How can art be made accessible to everybody? To answer this question I explored the links between art and science and I demonstrated that both deal with perception: art develops our sensitive approach whereas science relies on a deep knowledge of the eye and can alleviate its failures. I examined perception from a theoretical point of view, dwelling on the Gestalt theory as well as on the phenomena deriving from illusions and the synesthesia which emphasizes senses association. I then dealt with blindness, first with its terminology and statistics and then with the psychological and practical life experience of the visually impaired. Against this backdrop, my research led me to investigate the image of the visually impaired through literature and art in western culture. I assessed its evolution first from an analysis of its image in ancient Greece, then through a book entitled Les Aveugles by Sophie Calle and also through the Blue Period of melancholy Picasso. This led me to examine how the visually impaired connect with art in order to gauge how fundamental Braille is in painting, sculpture, photography performance etc. How can we perceive art without resorting to visual perception? By developing all other senses or by relying on visual perception economy? Architecture adapts to legal standards while developing a kind of inventiveness which enriches the “living together”. Regarding scientific innovations, revolutionary tools are being proposed such as sensory replacement devices, the artificial eye or a camera for the visually impaired. The perception being the key of a communication between clairvoyant and visually impaired.Cette thèse met en valeur une correspondance entre le système visuel humain d’un point de vue strictement scientifique et une expression plastique personnelle associant installations et photographies questionnant la mal-voyance. Comment rendre l'art accessible à tous ? Pour répondre à cette question nous avons interrogé les relations entre art et science et montré qu’ils sont tous deux concernés par la perception : l’art, car il développe une approche sensible, la science, car elle s’appuie sur une connaissance approfondie de l’œil et peut en pallier les défaillances. Nous avons étudié la perception d’un point vue théorique en nous attardant sur la théorie de la Gestalt, ainsi que les phénomènes que constituent les illusions et la synesthésie qui met en avant l’association des sens. Nous avons ensuite abordé la cécité à partir des points de vue terminologique et statistique, puis du vécu psychique et pratique du mal-voyant. Forts de cela, notre propos repère comment s’impose la figure de l’aveugle dans la culture occidentale à travers la littérature et les arts. De sa considération au cours de la Grèce antique à l’ouvrage, Les Aveugles, de Sophie Calle en passant par le Picasso mélancolique de la période bleue, nous avons pu apprécier l’évolution de son image. Il est alors temps de se pencher sur les rapports que le mal-voyant entretient avec l’art et, dans ce cadre l’intérêt que peut revêtir le braille qui infiltre la peinture, la sculpture, la photographie, la performance, etc. Comment appréhender l’art sans passer par le visuel en développant tous les autres sens ou en misant sur l’économie du visible ? L’architecture quant-à elle s’adapte aux normes juridiques tout en développant une créativité qui enrichit le vivre ensemble. Les innovations de la science en arrivent à proposer des outils révolutionnaires comme les dispositifs de substitution sensorielle, l’œil artificiel, ou encore un appareil photographie pour les mal-voyants. La perception étant la clé d’une communication entre voyant et mal-voyant

Thèses en Ligne