Extraction de relations : Exploiter des techniques complémentaires pour mieux s'adapter au type de texte

Aussenac-Gilles, Nathalie; Fabre, Cécile; Ghamnia, Adel; Kamel, Mouna; Trojahn, Cassia

research

Extraction de relations : Exploiter des techniques complémentaires pour mieux s'adapter au type de texte

Authors: Nathalie Aussenac-Gilles
Cécile Fabre
Adel Ghamnia
Mouna Kamel
Cassia Trojahn
Publication date: 1 January 2017
Publisher: 'Departmento Expresion Grafica y Cartografia'

Abstract

Extraire des relations d'hyperonymie à partir des textes est une des étapes clés de la construction automatique d'ontologies et du peuplement de bases de connaissances. Plusieurs types de méthodes (linguistiques, statistiques, combinées) ont été exploités par une variété de propositions dans la littérature. Les apports respectifs et la complémentarité de ces méthodes sont cependant encore mal identifiés pour optimiser leur combinaison. Dans cet article, nous nous intéressons à la complémentarité de deux méthodes de nature différente, l'une basée sur les patrons linguistiques, l'autre sur l'apprentissage supervisé, pour identifier la relation d'hyperonymie à travers différents modes d'expression. Nous avons appliqué ces méthodes à un sous-corpus de Wikipedia en français, composé des pages de désambiguïsation. Ce corpus se prête bien à la mise en oeuvre des deux approches retenues car ces textes sont particulièrement riches en relations d'hyperonymie, et contiennent à la fois des formulations rédigées et d'autres syntaxiquement pauvres. Nous avons comparé les résultats des deux méthodes prises indépendamment afin d'établir leurs performances respectives, et de les comparer avec le résultat des deux méthodes appliquées ensemble. Les meilleurs résultats obtenus correspondent à ce dernier cas de figure avec une F-mesure de 0.68. De plus, l'extracteur Wikipedia issu de ce travail permet d'enrichir la ressource sémantique DBPedia en français : 55% des relations identifiées par notre extracteur ne sont pas déjà présentes dans DBPedia

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

Open Archive Toulouse Archive Ouverte

oai:oatao.univ-toulouse.fr:190...

Last time updated on 07/07/2018