thesis

Aprendizaje activo para clasificación de preguntas

Abstract

Quepy es una librería para construir sistema de respuesta a preguntas sobre datos enlazados, sin embargo utiliza patrones estáticos para reconocer preguntas y alcanzar una gran cobertura es muy costoso. Utilizamos un clasificador bayesiano ingenuo para clasificar reformulaciones de preguntas semánticamente equivalentes, ligarlas a una misma interpretación y aumentar esta cobertura. La falta de un corpus de preguntas etiquetado nos llevó a utilizar aprendizaje activo tanto sobre instancias como sobre características. En la representación de las instancias incluimos también las concordancias con los patrones parciales del Quepy, para capturar la información semántica de la pregunta. En este escenario contamos con muchas de preguntas que no concuerdan con ningún patrón y muchas clases minoritarias con pocos ejemplos cada una. Los resultados indican que balancear el corpus de entrenamiento utilizado por el clasificador evita que la clase mayoritaria se convierta en la única clase reconocida, mientras que el entrenamiento con características aumentó en gran medida el reconocimiento de las clases minoritarias

    Similar works