Apports des analyses syntaxiques pour la détection automatique de mentions dans un corpus de français oral

Dinarelli, Marco; Grobol, Loïc; Landragin, Frédéric; Tellier, Isabelle; Villemonte de La Clergerie, Éric

Apports des analyses syntaxiques pour la détection automatique de mentions dans un corpus de français oral

Authors: Marco Dinarelli
Loïc Grobol
Frédéric Landragin
Isabelle Tellier
Éric Villemonte de La Clergerie
Publication date: 26 June 2017
Publisher: HAL CCSD

Abstract

National audienceWe present three experiments in detecting entity mentions in the corpus of oral French ANCOR, using publicly available parsing tools and state-of-the-art mention detection techniques used in coreference detection, anaphora resolution and Entity Detection and Tracking systems. While the tools we use are not specifically designed to deal with oral French, our results are comparable to those of state-of-the-art end-to-end systems for other languages. We also mention several ways to improve our results for future work in developing an end-to-end coreference resolution system for French, to which these experiments could be a baseline for mention detection.Cet article présente trois expériences de détection de mentions dans un corpus de français oral : ANCOR. Ces expériences utilisent des outils préexistants d'analyse syntaxique du français et des méthodes issues de travaux sur la coréférence, les anaphores et la détection d'entités nommées. Bien que ces outils ne soient pas optimisés pour le traitement de l'oral, la qualité de la détection des mentions que nous obtenons est comparable à l'état de l'art des systèmes conçus pour l'écrit dans d'autres langues. Nous concluons en proposant des perspectives pour l'amélioration des résultats que nous obtenons et la construction d'un système end-to-end pour lequel nos expériences peuvent servir de base de travail

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

INRIA a CCSD electronic archive server

oai:HAL:hal-01558711v1

Last time updated on 12/10/2017