Sociedad Española para el Procesamiento del Lenguaje Natural
Abstract
En este trabajo se examinan
algunos aspectos del etiquetado lingüístico
de un corpus técnico de informática en
lengua gallega, en lo que respecta a
cuestiones ortográficas, léxicas y
morfosintácticas. En primer lugar,
presentamos la características del corpus
analizado y algunas de las aplicaciones de
su procesamiento. A continuación,
mostramos las técnicas empleadas en su
anotación morfosintáctica, centrándonos en
la discusión de nuestra propuesta de
etiquetario y en el esquema de codificación.
Por último, presentamos una aproximación
a los problemas específicos que plantea la
anotación léxica, terminológica y
ortográfica del corpus