Location of Repository

Una aproximación multilingüe a la clasificación de preguntas basada en aprendizaje automático

By David Tomás, Jose-Luis Vicedo, Armando Suárez Cueto, Empar Bisbal Asensi and Lidia Moreno Boronat

Abstract

Este artículo presenta una aproximación multilingüe a la clasificación de preguntas basada en aprendizaje automático, empleando características de aprendizaje independientes del idioma. Esto va a permitir que el sistema sea flexible y fácilmente adaptable a nuevos idiomas. Sobre un corpus paralelo de preguntas en inglés y castellano, contrastaremos el rendimiento del sistema con tres métodos distintos de aprendizaje: Máquinas de Vectores Soporte, Máxima Entropía y aprendizaje basado en ejemplos.This paper presents a multilingual approach to question classification based on machine learning. This approach is flexible and easy to adapt to new languages using language independent learning features. The system’s performance has been compared in a parallel English-Spanish corpus of questions using three different learning methods: Support Vector Machines, Maximum Entropy and Memory-based Learning.Este trabajo ha sido subvencionado por el proyecto CICYT R2D2 (TIC2003-07158-C04) y por el Ministerio de Educación y Ciencia y el Fondo Social Europeo a través de la beca BES-2004-3935

Topics: Clasificación de preguntas, Multilingüe, Aprendizaje automático, Máquinas de vectores soporte, Máxima entropía, Aprendizaje basado en ejemplos, Question classification, Multilingual, Machine learning, Support vector machines, Maximum entropy, Memory-based learning
Publisher: Sociedad Española para el Procesamiento del Lenguaje Natural
Year: 2005
OAI identifier: oai:rua.ua.es:10045/1339
Journal:

Suggested articles

Preview


To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.