Location of Repository

Kernels para la clasificacíon de preguntas en español y catalán

By José Luis Vicedo and David Tomás

Abstract

<p>Este artículo presenta una aproximacíon a la clasificación automática de preguntas en español y catalán. El sistema de clasificación está basado en el algoritmo SVM y en el uso de diferentes funciones kernel, empleando únicamente características textuales superficiales que permiten la obtencíon de un sistema fácilmente adaptable a diferentes idiomas. Se ha realizado un estudio sobre el correcto a juste de parámetros de los kernels, la precisíon de los mismos, la definicíon de distintos vectores de características de aprendizaje y el rendimiento en función del idioma de trabajo. Adicionalmente, se ha experimentado con el algoritmo LIBLINEAR, aplicado aquí por vez primera a la tarea de clasificación de preguntas. Con este algoritmo, así como con los kernels definidos, se han obtenido valores de precisión por encima del 80 % para los dos idiomas tratados, superando a otros algoritmos tradicionales de clasificación. Para el entrenamiento y evaluación del sistema se ha desarrollado un corpus paralelo de 2.393 preguntas en inglés, español y catalán.</p&gt

Topics: Philology. Linguistics, P1-1091, Language and Literature, P, DOAJ:Linguistics, DOAJ:Languages and Literatures
Publisher: Universidade do Minho & Universidade de Vigo
Year: 2009
OAI identifier: oai:doaj.org/article:f21b28b5829746b0ada633a5600e9a56
Journal:
Download PDF:
Sorry, we are unable to provide the full text but you may find it at the following location(s):
  • https://doaj.org/toc/1647-0818 (external link)
  • http://www.linguamatica.com/in... (external link)
  • https://doaj.org/article/f21b2... (external link)
  • Suggested articles


    To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.