204 research outputs found

    Minería de textos: una herramienta útil para mejorar la gestión del bibliotecario en el entorno digital

    Get PDF
    In the current stage of human development, the boom, assimilation and intensive use of knowledge has led to what we know as Knowledge Society, in which information management, documentation and knowledge are considered as vital strategic components. The horizons have been widened towards other jobs summoned to cooperate with information professionals: system designers, data providers, editors, salespersons, archivists, technicians, engineers and electronic text codification specialists, whose opinions and experiences make possible the localization, management, retrieval and use of digital information. New tools have been created to make easier the access to the great amount of knowledge generated daily. One of the most used is Text Mining, which allows the different organizations to explore a great number of texts that are not organized in data form, as well as to establish patterns and to extract useful knowledge

    Identificación de relaciones entre los nodos de una red social

    Get PDF
    In this paper a review is conduced about representation and classifi cation of membership among nodes belonging to a social network. For this purpose, topics such as Natural Language Processing, Text Mining, Information Retrieval and Named Entities are considered description and survey of outstanding approaches is carry out in each topic.El presente artículo realiza una revisión del tema, representación y clasificación de de relaciones de pertenencia entre los nodos de una red social. Para ello, se abordan aspectos sobre Procesamiento de Lenguaje Natural, Minería de Texto, Recuperación de Informacióny Entidades Nombradas. Se hace una descripción de cada una de ellas y se referencian y discuten trabajos académicos destacados que se han desarrollado en dicho tema

    Introducción a la inteligencia de negocios con énfasis en una selección de algoritmos de minería de datos

    Get PDF
    La inteligencia de negocios es una herramienta de gran potencial, la cual está pasando por un momento de gran aceptación e inclusión en grandes compañías. A pesar de que muchas organizaciones implementan o quieren implementar herramientas de inteligencia de negocios, no hay muchas personas que conozcan a fondo el tema, o que puedan implementar dichas herramientas. Además, la incursión en el tema para nuevas personas es un poco complicada, ya que la documentación se encuentra dispersa y sin relación entre sí. Tal es el posicionamiento de la inteligencia de negocios en las grandes compañías, que cada día se necesitan más profesionales que puedan ayudar a establecer, soportar o implementar esta herramienta dentro de las organizaciones. Pero a pesar de la gran demanda que presenta este campo, muy pocas personas en el interior de las organizaciones poseen los conocimientos básicos sobre el tema. Los nuevos profesionales en campos de las ciencias de la computación terminan sus estudios de pregrado sin tener idea alguna de este campo de acción

    Combining lexical-syntactic patterns and topic analysis for automatic keyphrase extraction from texts

    Get PDF
    La extracción automática de frases relevantes constituye una tarea de gran importancia para muchas soluciones computacionales en el área del procesamiento de lenguaje natural y la minería de texto. En este trabajo se propone un nuevo método no supervisado para la extracción de frases relevantes en textos, en el cual se combina el uso de patrones léxico-sintácticos con una estrategia de análisis de tópicos basada en grafo. El método fue evaluado con los corpus SemEval-2010 e INSPEC y comparado con otras propuestas del estado del arte, obteniéndose resultados muy prometedores.The automatic keyphrases extraction is a useful task for many computational solutions in the natural language processing and text mining areas. In this paper, a new unsupervised method for keyphrase extraction from texts is proposed, in which the use of lexical-syntactic patterns is combined with a graph-based topic analysis strategy. The method was evaluated with the SemEval-2010 and INSPEC corpus, and compared with other state-of-the-art proposals, obtaining promising results.Este trabajo ha sido parcialmente financiado por el proyecto METODOS RIGUROSOS PARA EL INTERNET DEL FUTURO (MERINET), financiado por el Fondo Europeo de Desarrollo Regional (FEDER) y el Ministerio de Economía y Competitividad (MINECO), Ref. TIN2016-76843-C4-2-R

    Representación computacional del lenguaje natural escrito

    Get PDF
    When humans read, or hear, words, they immediately relatethem to a concept. This is possible due to the informationalready stored in the brain and also to human’s ability toselect, process, and associate such information with words.However, for a computer, natural language text is only asequence of bits that does not convey any meaning on itsown, unless properly processed. A computer interprets thisbit sequence by modeling the processing that takes place inhuman minds, namely structuring and linking the text withpreviously stored information. During this process, as wellas when describing its results, the text is represented usingvarious formal structures that permit automatic processing,interpretation, and comparison of information. In this paper,we present a detailed description of these structures.Cuando el ser humano lee o escucha una palabra, inmediatamente la relaciona con un concepto. Esto es posible gracias a la acumulación de información y a la posibilidad de filtrar, procesar y relacionar dicha información. Para la máquina, una expresión escrita en el lenguaje natural es una cadena de bits que no aporta información por sí sola. Un computador interpreta esta cadena de bits, modelando el proceso que tiene lugar en la mente humana, estructurando y relacionado la cadena con información previamente almacenada. En el proceso, así como al momento de describir los resultados, el texto es representado por estructuras formales que permiten el procesamiento automático, la interpretación y la comparación de la información. Este artículo presenta una descripción detallada de estas estructuras

    Herramienta informática para vigilancia tecnológica -vigtech-

    Get PDF
    El artículo presenta una herramienta de software que apoya la vigilancia teconológica. La herramienta permite encontrar relaciones cognitivas y sociales en un conjunto de documentos extraídos de una base referencial tal como SCOPUS. Específicamente, la herramienta soporta las actividades de obtención de información de documentos científicos, extracción de metadatos, cálculo de estadísticas descriptivas, análisis de redes sociales, análisis de redes de palabras claves y visualización. El artículo presenta una descripción de las bases conceptuales que fundamentaron el desarrollo de la herramienta, así como una descripción de su arquitectura y funcionalidad

    Revisión sistemática para las técnicas de minería Web de contenido

    Get PDF
    Trabajo de InvestigaciónDeterminar las principales técnicas empleadas de minería web que permiten realizar minería de contenido, con el fin de facilitar la búsqueda de información en bases documentales. Para ello se llevó a cabo una revisión sistemática de la información documentada en medios arbitrados en el período 2014 – 2018, empleando las bases documentales Redalyc, Scielo, Scopus, IEEEXplore, Google Scholar y Web of ScienceINTRODUCCIÓN 1. GENERALIDADES 2. DEFINICIÓN DE LOS CRITERIOS DE BÚSQUEDA DE ARTÍCULOS SOBRE MINERÍA DE CONTENIDO EN LA WEB 3. IDENTIFICACIÓN DE LAS TÉCNICAS QUE HAN SIDO EMPLEADAS PARA REALIZAR MINERÍA DE CONTENIDO EN LA WEB 4. CARACTERIZACIÓN DE LAS PRINCIPALES TÉCNICAS QUE HAN SIDO EMPLEADAS PARA REALIZAR MINERÍA DE CONTENIDO EN LA WEB 5. CONCLUSIONES 6. RECOMENDACIONES BIBLIOGRAFÍA ANEXOSPregradoIngeniero de Sistema

    Análisis de imágenes faciales basado en propiedades espectrales de grafos

    Get PDF
    La proliferación de diferentes fuentes de información de texto, imágenes y video en formato digital hace interesante la investigación de tecnologías de procesado de datos que puedan aplicarse independientemente del tipo de información permitiendo, eventualmente, un procesado integrado de múltiples fuentes de una manera que cupiera denominar semántica; por su nivel de abstracción y su potencial acercamiento a la forma en que el ser humano maneja la información. Este proyecto fin de carrera hace un análisis preliminar del empleo del análisis espectral de grafos definidos a partir de imágenes con el propósito anterior. Los resultados de esta investigación muestran que los espectros de los grafos definidos son mayormente degenerados, imposibilitando su uso para la categorización de imágenes, y que es necesaria una reorientación en la definición de los mismos

    Estructura de comunidades en las redes semánticas de la investigación biomédica sobre disparidades en salud y sexismo

    Get PDF
    Introduction: As an initiative to improve the quality of health care, the trend in biomedical research focused on health disparities and sex has increased.Objective: To carry out a characterization of the scientific evidence on health disparity defined as the gap between the distribution of health and the possible gender bias for access to medical services.Materials and methods: We conducted a simultaneous search of two fundamental descriptors in the scientific literature in the Medline PubMed database: healthcaredisparities and sexism. Subsequently, a main semantic network was built and some structural subunits (communities) were identified for the analysis of information organization patterns. We used open-source software: Cytoscape to analyze and visualize the semantic network, and MapEquation for community detection, as well as an ad hoc code available in a public access repository.Results: The core network corpus showed that the terms on heart disease were the most common among the descriptors of medical conditions. Patterns of information related to public policies, health services, social determinants, and risk factors were identified from the structural subunits, but with a certain tendency to remain indirectly connected to the nodes of medical conditions.Conclusions: Scientific evidence indicates that gender disparity does matter for the care quality in many diseases, especially those related to the circulatory system. However, there is still a gap between the medical and social factors that give rise to possible disparities by sex.Introducción. Como una iniciativa para mejorar la calidad de la atención sanitaria, en la investigación biomédica se ha incrementado la tendencia centrada en el estudio de las disparidades en salud y sexismo.Objetivo. Caracterizar la evidencia científica sobre la disparidad en salud definida como la brecha existente entre la distribución de la salud y el posible sesgo por sexo en el acceso a los servicios médicos.Materiales y métodos. Se hizo una búsqueda simultánea de la literatura científica en la base de datos Medline PubMed de dos descriptores fundamentales: Healthcare disparities y Sexism. Posteriormente, se construyó una red semántica principal y se determinaron algunas subunidades estructurales (comunidades) para el análisis de los patrones de organización de la información. Se utilizó el programa de código abierto Cytoscape para el analisis y la visualización de las redes y el MapEquation, para la detección de comunidades. Asimismo, se desarrolló código ex profeso disponible en un repositorio de acceso público.Resultados. El corpus de la red principal mostró que los términos sobre las enfermedades del corazón fueron los descriptores de condiciones médicas más concurrentes. A partir de las subunidades estructurales, se determinaron los patrones de información relacionada con las políticas públicas, los servicios de salud, los factores sociales determinantes y los factores de riesgo, pero con cierta tendencia a mantenerse indirectamente conectados con los nodos relacionados con condiciones médicas.Conclusiones. La evidencia científica indica que la disparidad por sexo sí importa para la calidad de la atención de muchas enfermedades, especialmente aquellas relacionadas con el sistema circulatorio. Sin embargo, aún se percibe un distanciamiento entre los factores médicos y los sociales que dan lugar a las posibles disparidades por sexo

    Propuesta de procedimiento para la construcción semiautomática de tesauros en Bibliotecas Universitarias

    Get PDF
    Objetivo Se proponen procedimientos de índole teóricos en la indización, y a la vez introduciéndose en parcelas de las Ciencias de la Computación para resolver problemas de la Red TIC del Proyecto VLIR desde una óptica multidisciplinar, dada las características imponen el reto  de  intentar desarrollar cualquier proceso normativo en el terreno de la indización para un entorno complejo y pluridisciplinar, siendo la primera vez que se asume un trabajo en Ciencias de la Información en la Universidad Central “Marta Abreu” de Las Villas (UCLV). Diseño/Metodología/Enfoque se utilizaron las técnicas de origen matemático: la Ley de Zip, TF-IDF, N-grams y Stop World Elimination, aportando un enfoque mixto predominantemente cuantitativo. La descripción sirve de guía para la construcción de léxicos especializados, al incluir los mecanismos de construcción basados en las reglas exigidas a nivel internacional. Resultados/Discusión: Desde el  diagnóstico de los Procesos de Indización en las Bibliotecas asociadas a la Red TIC del Proyecto VLIR, se aplicaron  métodos y técnicas en la recopilación de información permitieron obtener resultados relacionados a la experiencia en los procesos de indización y construcción de tesauros en las diversas universidades del país. Conclusiones: La creación de un procedimiento que proporcione la transformación de los vocabularios controlados en un lenguaje interoperable, facilita la indización y la recuperación eficiente de la información. Originalidad/Valor: El impacto social de uso estriba en que al contener datos estandarizados en formato SKOS, las plataformas que usa y desarrolla la red podrán interpretar con otras plataformas con fines similares dando visibilidad a la ciencia de la Red TIC
    corecore