20 research outputs found

    Propuesta de procedimiento para la construcción semiautomática de tesauros en Bibliotecas Universitarias

    Get PDF
    Objetivo Se proponen procedimientos de índole teóricos en la indización, y a la vez introduciéndose en parcelas de las Ciencias de la Computación para resolver problemas de la Red TIC del Proyecto VLIR desde una óptica multidisciplinar, dada las características imponen el reto  de  intentar desarrollar cualquier proceso normativo en el terreno de la indización para un entorno complejo y pluridisciplinar, siendo la primera vez que se asume un trabajo en Ciencias de la Información en la Universidad Central “Marta Abreu” de Las Villas (UCLV). Diseño/Metodología/Enfoque se utilizaron las técnicas de origen matemático: la Ley de Zip, TF-IDF, N-grams y Stop World Elimination, aportando un enfoque mixto predominantemente cuantitativo. La descripción sirve de guía para la construcción de léxicos especializados, al incluir los mecanismos de construcción basados en las reglas exigidas a nivel internacional. Resultados/Discusión: Desde el  diagnóstico de los Procesos de Indización en las Bibliotecas asociadas a la Red TIC del Proyecto VLIR, se aplicaron  métodos y técnicas en la recopilación de información permitieron obtener resultados relacionados a la experiencia en los procesos de indización y construcción de tesauros en las diversas universidades del país. Conclusiones: La creación de un procedimiento que proporcione la transformación de los vocabularios controlados en un lenguaje interoperable, facilita la indización y la recuperación eficiente de la información. Originalidad/Valor: El impacto social de uso estriba en que al contener datos estandarizados en formato SKOS, las plataformas que usa y desarrolla la red podrán interpretar con otras plataformas con fines similares dando visibilidad a la ciencia de la Red TIC

    Una aproximación basada en aprendizaje automático para diversos problemas de procesamiento de lenguaje natural en redes sociales

    Full text link
    [EN] This work is focused on solving several Natural Language Processing tasks, for which an approach based on machine learning algorithms was used. The tasks addressed were: language identification, sentiment analysis and author profi- ling. These tasks were proposed by international competitions which have led to publish several papers. A data set of social media texts were used in these tasks, mainly from Twitter. Overall, these texts present some characteristics (short and ungramatical texts) that are challenging for Natural Language Processing techniques. For each task, the state-of-the-art is studied and a model to solve the task is proposed. In order to create a valid model, several resources and supervised machine learning tech- niques were used. Finally, the results obtained were analyzed and improvements to the model were proposed to enhance the behavior of the model.[ES] Este trabajo se centra en la resolución de distintas tareas propias del procesamiento automático del lenguaje natural, para lo cual se emplea una aproximación basada en aprendizaje automático. Las tareas consideradas son: la detección del idioma, el análisis de sentimientos y la creación de perfiles de usuario. Se trata de tareas propuestas en competiciones internacionales y que han dado lugar a diversas publicaciones. Todas estas tareas se plantearon utilizando datos extraídos de redes sociales, en particular textos de Twitter. En general, los textos que pueden encontrarse en estos medios poseen una serie de características (textos cortos y agramaticales) que plantean nuevos retos para el procesamiento del lenguaje natural. En cada caso, se estudia el estado del arte y se propone un modelo que se ajuste a los requisitos de la tarea. Para ello, se emplean los recursos y los algoritmos de aprendizaje automático supervisado más adecuados. Finalmente, se ha analizado los resultados y se plantean futuras modificaciones que mejoren el comportamiento de los sistemas planteados.Giménez Fayos, MT. (2016). Una aproximación basada en aprendizaje automático para diversos problemas de procesamiento de lenguaje natural en redes sociales. http://hdl.handle.net/10251/64031TFG

    Diseño de formularios para la descripción del documento durante su ciclo vital basado en la ISAD (G)

    Get PDF
    Profesional en Ciencia de la Información - Bibliotecólogo (a)Pregrad

    El lenguaje económico alemán y español de la prensa especializada : análisis basado en un corpus de la crisis económica (CRISCORP)

    Get PDF
    Programa de Doctorado en Lenguas Modernas, Traducción y Español como Lengua ExtranjeraEn esta tesis se analiza el lenguaje especializado de la crisis económica procedente de textos de la prensa especializada mediante la explotación de un corpus comparable alemán-español que hemos compilado de forma cronológica (mismo suceso en ambas lenguas) y que hemos denominado CrisCorp. El estudio arroja similitudes y diferencias del lenguaje de la crisis económica en cada uno de los códigos lingüísticos, y pone el foco en aquellos aspectos definitorios que más sobresalen: las metáforas, los extranjerismos y las expresiones cuantitativas. Tratamos de conocer el comportamiento del par de lenguas de nuestro interés en cuanto a los fenómenos léxicos mediante el análisis contrastivo y la ayuda del programa de análisis y tratamiento de corpus, Sketch Engine. Esta tesis se inscribe en la lingüística contrastiva, pero también en la lingüística descriptiva y la lingüística de corpus.Universidad Pablo de Olavide. Departamento de Filología y Traducció

    Metodología para la construcción de córpora textuales estructurados basados en XML

    Get PDF
    En este trabajo analizamos los aspectos más relevantes para definir una metodología que posibilite la construcción de córpora textuales estructurados basados en XML.In this article we discuss the most important issues in the definition of a methodology for the development of structured text corpora based on XML.Parcialmente financiado por el Ministerio de Educación y Ciencia (TIN2004-07246-C03-01), Xunta de Galicia (PGIDIT05PXIC30501PN) y Universidade de Vigo

    Selección de socios en las Empresas Virtuales Dinámicas

    Get PDF
    En el presente documento se describen los aspectos más importantes asociados a la aplicación software DVEBreeder. Esta herramienta ha sido creada expresamente para facilitar el proceso de selección de socios en las Empresas Virtuales Dinámicas utilizando, para ello, dos tecnologías procedentes del ámbito de la Inteligencia Artificial, como son los Sistemas Multiagente y los Sistemas Expertos. En dicha aplicación el proceso de selección se realiza en base a un modelo que engloba y amplía las posibilidades de los distintos enfoques existentes en la literatura, y en el que se hace uso del reciente concepto de Entornos de Gestación.Departamento de Informátic

    Las Humanidades Digitales desde Argentina.Tecnologías, culturas, saberes

    Get PDF
    Las Humanidades Digitales desde Argentina.Tecnologías, culturas, saberes, v contains most of the works presented at the First Digital l Humanities Conference organized by the Asociación Argentina de Humanidades Digitales (AAHD) in Buenos Aires, Argentina, in 2014. All of the articles are in Spanis

    Las Humanidades Digitales desde Argentina.Tecnologías, culturas, saberes

    Get PDF
    Las Humanidades Digitales desde Argentina.Tecnologías, culturas, saberes, v contains most of the works presented at the First Digital l Humanities Conference organized by the Asociación Argentina de Humanidades Digitales (AAHD) in Buenos Aires, Argentina, in 2014. All of the articles are in Spanis

    Las Humanidades Digitales desde Argentina : Tecnologías, culturas, saberes

    Get PDF
    Volumen que reúne los trabajos presentados en las I Jornadas Nacionales de la Asociación Argentina de Humanidades Digitales (AAHD), celebradas en el Centro Cultural General San Martín (CABA), del 17 al 19 de noviembre de 2014.Asociación Argentina de Humanidades Digitale
    corecore