research

JBeaver: análisis y generación de analizadores de dependencias

Abstract

JBeaver es un sistema de análisis y generación de analizadores de dependencias. Podemos crear corpora de entrenamiento, entrenar a un sistema automático de aprendizaje y por último realizar análisis y evaluarlos tanto gráfica como estadísticamente. Todo ello siendo éste un sistema autónomo, fácil de usar, portable, con un alto rendimiento y por supuesto, debido a su carácter didáctico y de investigación, público y gratuito. El sistema consta de tres módulos funcionales: Entrenamiento: Crea corpora de dependencias a partir de árboles de constituyentes mediante la transformación del algoritmo de Gelbukh (Universidad Autónoma de México). Realiza el entrenamiento de la herramienta de aprendizaje automático Maltparser_0.4 por medio del corpus de dependencias, generando un modelo.Evalúa los resultados para garantizar la calidad del entrenamiento, usando las métricas: Label attachment score (LAS), Unlabel attachment score (UAS) y Label accuracy. Análisis : Etiqueta cada token de un texto con sus part-of-speach (categorías gramaticales). Analiza el texto de entrada, ya etiquetado, gracias al modelo creado en el entrenamiento. Evalúa los resultados para garantizar la calidad del análisis, usando las métricas: Label attachment score (LAS), Unlabel attachment score (UAS) y Label accuracy. Gráco: Muestra en forma de árbol todas las frases que seleccionemos tanto del análisis como del entrenamiento. Existen dos formas de visualización: Por pasos (para observar su creación) Directamente

    Similar works