Sociedad Española para el Procesamiento del Lenguaje Natural
Abstract
En este trabajo se presenta el diseño de un sistema de Reconocimiento
de Entidades para textos escritos en vasco. Para el desarrollo de dicho sistema se
han probado diferentes técnicas, algunas de ellas basadas en información lingüística
y otras en cambio aplicando diversos métodos de aprendizaje automático. Además
de presentar cada técnica por separado y sus correspondientes experiementos con
diferentes fuentes de información, proponemos también una serie de combinaciones
con diferentes metodos para obtener así un sistema más completo y robusto. Para
concluir, presentamos las conclusiones y reflexiones concluidas de todos estos experimentos,
especialmente válidas para aquellos sistemas que traten el reconocimiento
de entidades en textos escritos en otros idiomas que no sea el inglés.This paper presents the conclusions reached from the development of
a system for Named Entity recognition in written Basque. In order to obtain this
recognizer we have worked with different types of classifiers, one of them based
on linguistic information and others constructed using machine learning methods.
Taking these classifiers as starting point, and once we explain the different attempts
done with each simple method using different information sources, we present the
experiments we did combining those single methods in order to improve the performance
and obtain a more robust system. Finally, we explain some conclusions and
lessons we have learned from all these experiments, especially useful when dealing
with named entity recognition in languages others than English.This research has been partially funded
by the European Commision (MEANING
IST-2001-34460) and the Basque Government
(Saiotek-Ihardetsi and BFI04.432)
Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.