Search CORE

46 research outputs found

ANNODIS : une approche outillée de l'annotation de structures discursives

Author: Asher Nicholas
Benamara Farah
Bras Myriam
Enjalbert Patrice
Fabre Cécile
Ferrari Stéphane
Ho-Dac Lydia-Mai
Le Draoulec Anne
Mathet Yann
Muller Philippe
Prévot Laurent
Péry-Woodley Marie-Paule
Rebeyrolle Josette
Tanguy Ludovic
Vergez-Couret Marianne
Vieu Laure
Widlöcher Antoine
Publication venue: HAL CCSD
Publication date: 24/06/2009
Field of study

International audienceThe ANNODIS project has two interconnected objectives: to produce a corpus of texts annotated at discourse-level, and to develop tools for corpus annotation and exploitation. Two sets of annotations are proposed, representing two complementary perspectives on discourse organisation: a bottom-up approach starting from minimal discourse units and building complex structures via a set of discourse relations; a top-down approach envisaging the text as a whole and using pre-identified cues to detect discourse macro-structures. The construction of the corpus goes hand in hand with the development of two interfaces: the first one supports manual annotation of discourse structures, and allows different views of the texts using NLP-based pre-processing; another interface will support the exploitation of the annotations. We present the discourse models and annotation protocols, and the interface which embodies them.Le projet ANNODIS vise la construction d'un corpus de textes annotés au niveau discursif ainsi que le développement d'outils pour l'annotation et l'exploitation de corpus. Les annotations adoptent deux points de vue complémentaires : une perspective ascendante part d'unités de discours minimales pour construire des structures complexes via un jeu de relations de discours ; une perspective descendante aborde le texte dans son entier et se base sur des indices pré-identifiés pour détecter des structures discursives de haut niveau. La construction du corpus est associée à la création de deux interfaces : la première assiste l'annotation manuelle des relations et structures discursives en permettant une visualisation du marquage issu des prétraitements ; une seconde sera destinée à l'exploitation des annotations. Nous présentons les modèles et protocoles d'annotation élaborés pour mettre en œuvre, au travers de l'interface dédiée, la campagne d'annotation

HAL - Normandie Université

Scientific Publications of the University of Toulouse II Le Mirail

HAL AMU

HAL Descartes

Analyse macro-sémantique : vers une analyse rhétorique du discours

Author: Widlöcher Antoine
Publication venue: HAL CCSD
Publication date: 01/01/2004
Field of study

National audienc

HAL - Normandie Université

Modélisation par contraintes pour la description et l'analyse automatique de la structure du discours

Author: Widlöcher Antoine
Publication venue: Presses universitaires de Louvain
Publication date: 01/01/2008
Field of study

International audienc

HAL - Normandie Université

Annotation, évaluation et mesure d’accord en linguistique de corpus

Author: Mathet Yann
Widlöcher Antoine
Publication venue: 'CAIRN'
Publication date: 01/01/2019
Field of study

National audienc

HAL - Normandie Université

Analyse par contraintes de l'organisation du discours

Author: Widlöcher Antoine
Publication venue: Presses Universitaires de Louvain
Publication date: 01/01/2006
Field of study

National audienc

HAL - Normandie Université

La plate-forme d'annotation Glozz

Author: Mathet Yann
Widlöcher Antoine
Publication venue: HAL CCSD
Publication date: 01/01/2009
Field of study

National audienc

HAL - Normandie Université

Une approche holiste et unifiée de l'alignement et de la mesure d'accord inter-annotateurs

Author: Mathet Yann
Widlöcher Antoine
Publication venue: HAL CCSD
Publication date: 27/06/2011
Field of study

National audienceBuilding reference corpora makes it necessary to align annotations and to measure agreement among annotators, in order to test the reliability of the annotated ressources. In this paper, we argue that alignment and agreement measure are interrelated : agreement measure applies to pre-aligned data and alignment assumes a prior agreement measure. We describe here a formal and computational framework which takes this interrelation into account, and relies on the notion of disorder of annotation sets available for a text. In this framework, the best alignment is the one which has the minimal disorder, and this disorder reflects an agreement measure of these data. This approach is said to be holistic insofar as alignment and measure depend on the system as a whole and cannot be locally determined. This holism introduces a computational cost which has been reduced by a heuristic strategy, implemented within the Glozz annotation platform.L'alignement et la mesure d'accord sur des textes multi-annotés sont des enjeux majeurs pour la constitution de corpus de référence. Nous défendons dans cet article l'idée que ces deux tâches sont par essence interdépendantes, la mesure d'accord nécessitant de s'appuyer sur des annotations alignées, tandis que les choix d'alignements ne peuvent se faire qu'à l'aune de la mesure qu'ils induisent. Nous proposons des principes formels relevant cette gageure, qui s'appuient notamment sur la notion de désordre du système constitué par l'ensemble des jeux d'annotations d'un texte. Nous posons que le meilleur alignement est celui qui minimise ce désordre, et que la valeur de désordre obtenue rend compte simultanément du taux d'accord. Cette approche, qualifiée d'holiste car prenant en compte l'intégralité du système pour opérer, est algorithmiquement lourde, mais nous sommes parvenus à produire une implémentation d'une version légèrement dégradée de cette dernière, et l'avons intégrée à la plate-forme d'annotation Glozz

HAL - Normandie Université