Sociedad Española para el Procesamiento del Lenguaje Natural
Abstract
Este trabajo explora la división de atributos en grupos para poder
mejorar la desambiguación de acepciones (WSD) mediante la combinación de sistemas
entrenados en cada uno de estos grupos de atributos. Los resultados conseguidos
demuestran que sólo k-NN es capaz de obtener beneficio de la combinación de la
división de atributos, y que el voto único no es suficiente para la mejora. Por
ello proponemos combinar todo los subsistemas k-NN donde cada vecino da su voto
según su rango de vecindad. Para la evaluación hemos utilizado dos conjuntos
de datos (Senseval-3 Lexical-Sample y All-words ), fijando las mejores opciones
de combinación en un tercer conjunto de datos (Senseval-2 Lexical-Sample). Los
resultados para la tarea All-words de Senseval-3 son los mejores que se han publicado
hasta el día de hoy. Los resultados del Lexical-Sample se situan entre los mejores
en el estado-del-arte.This paper explores the split of features sets in order to obtain better
wsd systems through combinations of classifiers learned over each of the split feature
sets. Our results show that only k-NN is able to profit from the combination
of split features, and that simple voting is not enough for that. Instead we propose
combining all k-NN subsystems where each of the k neighbors casts one vote. We
have performed a thorough evaluation on two datasets (Senseval-3 Lexical-Sample
and All-words), having set the best combination options in a development dataset
(Senseval-2 Lexical-Sample). The results for the All-Words task are the best published
up to date. The results for the lexical sample are state-of-the-art