Sociedad Española para el Procesamiento del Lenguaje Natural
Abstract
En el desarrollo de sistemas basados en la interacción, es necesario transcribir y analizar una gran cantidad de corpus. Este análisis es desarrollado a través de distintos niveles lingüísticos, entre los que se encuentra el nivel pragmático. Este trabajo presenta cómo desarrollar esta tarea y describe las partes relevantes del conocimiento que deben tratarse en este análisis. Para ello se presenta un conjunto de tareas para realizar la anotación pragmática del corpus con el objetivo de conseguir una metodología que facilite este trabajo a los desarrolladores y asegure completitud y rigor en el modelado de este conocimiento. Con estas propiedades se conseguirá que los corpus anotados a través de esta metodología puedan ser reutilizados, de manera total o parcial, en otros dominios de interacción.For developing corpus based interaction systems, it is necessary to acquire,
transcribe, and analyze significant amount of corpus. Such analysis should be performed at several linguistic levels, among which pragmatics is surely found. This work proposes how to perform that task and describes part of the relevant knowledge to be met through that analysis.
The approach presents a set of steps to be tracking during the pragmatic annotation of corpus. The proposed steps aim to guide dialogue coders to attain completeness in the analysis and maximize their agreement in their joint work.The presented work has been developed within the MAVIR
project (endorsed by the Regional Government of Madrid), and is
being extended through the SOPAT project (supported by the
Spanish Ministry of Science and Education)