research

Aspectos ortográficos, léxicos y morfosintácticos del etiquetado lingüístico de un corpus de informática en lengua gallega

Abstract

En este trabajo se examinan algunos aspectos del etiquetado lingüístico de un corpus técnico de informática en lengua gallega, en lo que respecta a cuestiones ortográficas, léxicas y morfosintácticas. En primer lugar, presentamos la características del corpus analizado y algunas de las aplicaciones de su procesamiento. A continuación, mostramos las técnicas empleadas en su anotación morfosintáctica, centrándonos en la discusión de nuestra propuesta de etiquetario y en el esquema de codificación. Por último, presentamos una aproximación a los problemas específicos que plantea la anotación léxica, terminológica y ortográfica del corpus

    Similar works