Sociedad Española para el Procesamiento del Lenguaje Natural
Abstract
Este artículo presenta los primeros pasos dados para la obtención de un analizador
sintáctico estadístico para el euskera. El sistema se basa en un treebank anotado sintácticamente
mediante dependencias y la adaptación del analizador sintáctico determinista de Nivre et al.
(2007), que mediante un análisis por desplazamiento/reducción y un sistema basado en
aprendizaje automático para determinar cuál de 4 opciones debe realizar, obtiene un único
análisis sintáctico de la oración. Los resultados obtenidos se encuentran cerca de los obtenidos
por sistemas similares.This paper presents the first steps towards a statistical syntactic analyzer for Basque.
The system is based on a syntactically dependency annotated treebank and an adaptation of the
deterministic syntactic analyzer of Nivre et al. (2007), which relies on a shift/reduce
deterministic analyzer together with a machine learning module that determines which one of 4
analysis options to take, giving a unique syntactic dependency analysis of an input sentence.
The results are near to those obtained by similar systems.Este trabajo está subvencionado por el
Departamento de Industria y Cultura del
Gobierno Vasco (proyecto AnHITZ 2006,
IE06-185)