Sociedad Española para el Procesamiento del Lenguaje Natural
Abstract
Este artículo presenta el resultado del estudio de un amplio conjunto
de bases de conocimiento multilíngües actualmente disponibles que pueden ser de
interés para un gran número de tareas de procesamiento semántico a gran escala. El
estudio incluye una amplia gama de recursos derivados de forma manual y automática
para el inglés y castellano. Con ello pretendemos mostrar una imagen clara de su
estado actual. Para establecer una comparación justa y neutral, la calidad de cada
recurso se ha evaluado indirectamente usando el mismo método en dos tareas de resolución de la ambigüedad semántica de las palabras (WSD, del inglés Word Sense
Disambiguation). En concreto, las tareas de muestra léxica del inglés del Senseval-3.This report presents a wide survey of publicly available multilingual
Knowledge Resources that could be of interest for wide–coverage semantic processing
tasks. We also include an empirical evaluation in a multilingual scenario of the
relative quality of some of these large-scale knowledge resources. The study includes
a wide range of manually and automatically derived large-scale knowledge resources
for English and Spanish. In order to establish a fair and neutral comparison, the
quality of each knowledge resource is indirectly evaluated using the same method
on a Word Sense Disambiguation task (Senseval-3 English Lexical Sample Task).Este trabajo ha sido parcialmente financiado por
grupo IXA de la UPV/EHU y los proyectos KNOW
(TIN2006-15049-C03-01) y ADIMEN (EHU06/113)