22 research outputs found

    Analyse de concepts formels pour la construction d'ontologies Ă  partir de textes : la question du corpus

    No full text
    Nous nous intéressons à l'évaluation d'une méthode permettant l'acquisition de hiérarchies à partir de textes. L'analyse de concepts formels semble donner de bons résultats dans les travaux de Cimiano et al. (2005) et plus récemment Bendaoud et al. (2007). Nous montrons que sur certains corpus les résultats semblent moins utilisables. Est-ce dû au style du texte ? Au domaine à modéliser ? Après une présentation de la méthode utilisée pour construire nos contextes formels, nous analysons les résultats obtenus sur différents corpus. Plusieurs variantes de construction des contextes formels sont proposées, axées sur la sélection des objets, avec pour objectif d'améliorer l'utilisabilité du treillis dans un contexte de conceptualisation semi-automatique

    Between browsing and search, a new model for navigating through large documents

    No full text
    International audienceThis paper proposes a new model for document access, which combines the search and browsing approaches. We define a good navigation as a navigation which is as quick and direct as possible and which offers good precision and recall rates in finding the text segments that are relevant for the user's information need. Our navigation model relies on recent advances in natural language processing and it is based on two traditional cognitive principles that are inherited from works on the visualization of information. This model is implemented in a navigation prototype which is designed for physicians who want to consult official recommendations to take medical decisions. Even if this model has not been really evaluated yet, we show the dynamicity and the efficiency of our approach on few detailled examples

    Construction d'ontologies Ă  partir de textes : la phase de conceptualisation

    No full text
    Dans cet article nous nous interrogeons sur la manière d'outiller la phase de conceptualisation lors de la construction d'une ontologie à partir de textes. La mise en perspective des résultats obtenus à partir de techniques issues de la terminologie et de la fouille de textes est réalisée selon trois plans (discours, linguistique et conceptuel). Cette étude permet de mieux appréhender les moyens envisageables pour outiller efficacement et de façon cohérente le processus de conceptualisation

    Etude de la navigation dans un document structuré. Application aux guides des bonnes pratiques médicales.

    No full text
    Mémoire de master 2 recherche MICRLa problématique de l'accès documentaire est née de l'augmentation exponentielle du volume des informations disponibles ces deux dernières décennies. Les recherches dans ce domaine visent à améliorer l'interface entre les humains et les connaissances contenues dans les documents. Notre système s'inscrit dans ce cadre. Bien qu'appliqués aux guides des bonnes pratiques médicales, les principes dégagés dans ce mémoire ont pour ambition de s'appliquer à tous les corpus structurés pour lesquels les besoins de fiabilité se font ressentir

    Construction d'ontologies Ă  partir de textes. L'apport de l'analyse de concepts formels.

    No full text
    Equipe RCLNBuild an ontology is a tedious task, which still requires a great amount of manual work. Texts, as knowledge sources, can help, but TALN tools stop at linguistic level. Manual conceptualization fill the gap between a linguistic model and a conceptual model. In this thesis we study how a symbolic clustering method, Formal Concept Analysis, can be combined with a linguistic model to help the knowledge engineer. We have experimented on three different domains represented by same-sized corpora. We show that ontology learning from texts cannot be fully automatized. We propose solutions that combine FCA and terminological analysis, to let the computer suggests useful clusters and faithful representation of texts.La construction d'ontologies est un processus fastidieux qui nécessite un travail manuel conséquent. Les textes, en tant que sources de connaissances, peuvent optimiser les recours aux experts du domaine. Le passage des textes à l'ontologie requiert un double changement de perspective. Tout d'abord du niveau du discours vers le niveau linguistique (terminologie, hyperonymie, synonymie, etc.), à l'aide d'outils de traitement automatique des langues. La conceptualisation, manuelle, permet ensuite d'entrer dans le monde des modèles. Nous étudions dans cette thèse comment une méthode de regroupement automatique, l'analyse de concepts formels (ACF), peut se combiner aux éléments du niveau linguistique afin de faciliter la tâche de conceptualisation. Nous avons mené des expérimentations sur trois domaines différents, représentés par des corpus de taille comparable. Nous montrons que, dans l'état actuel des connaissances, la construction d'ontologies à partir de textes ne peut s'effectuer de manière totalement automatique. Nous proposons plusieurs paramétrages pour s'affranchir des problèmes inhérents à l'utilisation de l'ACF sur les données textuelles, dans l'optique de fournir à l'utilisateur à la fois des regroupements pertinents et une vue fidèle sur le matériau textuel

    ValiTerms (software)

    No full text
    ValiTerms is an HTML5 interface generator that helps the validation of terms in a corpus. ValiTerms finds their occurrences and presents them to users into a pretty html page. This software is released on SourceForge (http://sourceforge.net/projects/valiterms)ValiTerms is an HTML5 interface generator that helps the manual validation of terms in a corpus

    Construction d'Ontologies Ă  partir de Textes. Application au Droit International du Travail.

    No full text
    National audienceCe poster présente mon sujet de thèse, qui se situe à la frontière entre le TAL et l'IC. Le but applicatif de cette thèse est la construction d'une ontologie du domaine du droit international du travail. Cette ontologie est conçue pour aider les juristes dans le traitement des cas de violation des conventions internationales du travail. Les principaux enjeux de recherche sont la semi-automatisation de l'intégration des ressources externes dans la méthode Terminae et l'étude de l'articulation entre les niveaux conceptuels et linguistiques, en vue de l'indexation des documents

    Construction d'ontologies Ă  partir de textes (L'apport de l'analyse de concepts formels)

    No full text
    La construction d'ontologies est un processus fastidieux qui nécessite un travail manuel conséquent. Les textes, en tant que sources de connaissances, peuvent optimiser les recours aux experts du domaine. Le passage des textes à l'ontologie requiert un double changement de perspective. Tout d'abord du niveau du discours vers le niveau linguistique (terminologie, hyperonymie, synonymie, etc.), à l'aide d'outils de traitement automatique des langues. La conceptualisation, manuelle, permet ensuite d'entrer dans le monde des modèles. Nous étudions dans cette thèse comment une méthode de regroupement automatique, l'analyse de concepts formels (ACF), peut se combiner aux éléments du niveau linguistique afin de faciliter la tâche de conceptualisation. Nous avons mené des expérimentations sur trois domaines différents, représentés par des corpus de taille comparable. Nous montrons que, dans l'état actuel des connaissances, la construction d'ontologies à partir de textes ne peut s'effectuer de manière totalement automatique. Nous proposons plusieurs paramétrages pour s'affranchir des problèmes inhérents à l'utilisation de l'ACF sur les données textuelles, dans l'optique de fournir à l'utilisateur à la fois des regroupements pertinents et une vue fidèle sur le matériau textuel.Construction of ontologies is a tedious task which still requires a great amount of manual work. Texts, as knowledge sources, can help, but TALN tools stop at linguistic level. Manual conceptualization fill the gap between a linguistic model and a conceptual model. In this thesis we study how a symbolic clustering method, Formal Concept Analysis, can be combined with a linguistic model to help the knowledge engineer. We have experimented on three different domains represented by same-sized corpora. We show that ontology learning from texts cannot be fully automatized. We propose solutions that combine FCA and terminological analysis, to let the computer suggest usefull clusters and faithful representation of texts.PARIS13-BU Sciences (930792102) / SudocSudocFranceF
    corecore