2 research outputs found

    Identificación automática de marcadores lingüísticos de ingredientes de receta de cocina costarricense mediante modelos de lenguaje y clasificadores automáticos

    Get PDF
    Un contexto definicional o definitorio es un texto en el cual se encuentran t ́ermi-nos con su correspondiente definici ́on. El an ́alisis de estos contextos tiene como enfo-que identificar patrones utilizados en el texto para expresar las relaciones conceptuales(v ́ınculos que conectan a los t ́erminos entre s ́ı) representativas del dominio en estudio.La identificaci ́on de dichos patrones permite extraer la terminolog ́ıa o el l ́exico espec ́ıficoutilizados en un dominio especializado. Este tipo de an ́alisis es generalmente realizadopor expertos ling ̈uistas sobre peque ̃nos conjuntos de datos de manera manual.Este trabajo representa una continuaci ́on de la investigaci ́on realizada en[Corrales et al., 2018] con la t ́ecnica de reglas y etiquetado de texto. En el presenteestudio, se emplean modelos de lenguaje y clasificadores autom ́aticos de texto paraidentificar marcadores ling ̈u ́ısticos delimitadores de ingredientes de cocina en el domi-nio de recetas de cocina costarricense. Los clasificadores utilizados fueronNaive BayesySupport Vector Machineen la herramienta Weka. Los insumos utilizados para el en-trenamiento y prueba de los modelos proven ́ıan de los mismos documentos utilizadospor [Corrales et al., 2018].Para cada modelo se evalu ́o la precisi ́on de los resultados. La mejora en los resultadosdel problema se evalu ́o utilizando una prueba de T-student. Al concluir este trabajo,se ofrece, de manera satisfatoria, una mejora en la precisi ́on de los resultados de laidentificaci ́on de marcadores ling ̈u ́ısticos delimitadores de ingredientes de cocina al usarclasificadores autom ́aticos de texto.UCR::Vicerrectoría de Investigación::Sistema de Estudios de Posgrado::Ingeniería::Maestría Profesional en Computación e Informátic

    Text analysis for automatic identification of definitional linguistic markers in Costa Rican gastronomy recipes

    Get PDF
    El análisis de contextos definicionales permite clasificar y sistematizar las informaciones definicionales pertenecientes a un dominio específico y, posteriormente, identificar estándares de las formas en que se definen las palabras y términos en tal dominio. En este artículo,se describe el proceso realizado para automatizar el análisis de contextos definicionales en el dominio gastronómico de Costa Rica. La labor se realizó mediante el uso de herramientas computacionales para el procesamiento de lenguaje natural. La automatización permite el análisis sobre grandes volúmenes de datos y obtener resultados en menos tiempo del requerido por el análisis manual. Ahora bien, el procedimiento consta de dos módulos,uno de clasificación de documentos en textos con recetas o sin ellas y un segundo módulo de identificación de los ingredientes de cocina con base en patrones lingüísticos formales.The analysis of definitional contexts allows to classify and systematize the definitional information belonging to a specific domain, and then to identify standards for the forms in which words and terms are defined in this domain. This paper describes the process implemented to automate the analysis of definitional contexts in the gastronomy domain in Costa Rica. The automation was done by using computational tools for natural language processing. The automation enables analysis of large quantities of data and results in less time than required by manual analysis. Automation consists of two modules, the first one is for the classification of documents in texts with or without recipes and the second one is for the identification of recipe ingredients based on formal linguistic patterns.UCR::Vicerrectoría de Docencia::Ingeniería::Facultad de Ingeniería::Escuela de Ciencias de la Computación e InformáticaUCR::Vicerrectoría de Docencia::Artes y Letras::Facultad de Letras::Escuela de Filología, Lingüística y LiteraturaUCR::Vicerrectoría de Investigación::Unidades de Investigación::Artes y Letras::Instituto de Investigaciones Lingüísticas (INIL
    corecore