467 research outputs found

    Propuesta de procedimiento para la construcción semiautomática de tesauros en Bibliotecas Universitarias

    Get PDF
    Objetivo Se proponen procedimientos de índole teóricos en la indización, y a la vez introduciéndose en parcelas de las Ciencias de la Computación para resolver problemas de la Red TIC del Proyecto VLIR desde una óptica multidisciplinar, dada las características imponen el reto  de  intentar desarrollar cualquier proceso normativo en el terreno de la indización para un entorno complejo y pluridisciplinar, siendo la primera vez que se asume un trabajo en Ciencias de la Información en la Universidad Central “Marta Abreu” de Las Villas (UCLV). Diseño/Metodología/Enfoque se utilizaron las técnicas de origen matemático: la Ley de Zip, TF-IDF, N-grams y Stop World Elimination, aportando un enfoque mixto predominantemente cuantitativo. La descripción sirve de guía para la construcción de léxicos especializados, al incluir los mecanismos de construcción basados en las reglas exigidas a nivel internacional. Resultados/Discusión: Desde el  diagnóstico de los Procesos de Indización en las Bibliotecas asociadas a la Red TIC del Proyecto VLIR, se aplicaron  métodos y técnicas en la recopilación de información permitieron obtener resultados relacionados a la experiencia en los procesos de indización y construcción de tesauros en las diversas universidades del país. Conclusiones: La creación de un procedimiento que proporcione la transformación de los vocabularios controlados en un lenguaje interoperable, facilita la indización y la recuperación eficiente de la información. Originalidad/Valor: El impacto social de uso estriba en que al contener datos estandarizados en formato SKOS, las plataformas que usa y desarrolla la red podrán interpretar con otras plataformas con fines similares dando visibilidad a la ciencia de la Red TIC

    Tesauros y ontologías para las fotografías

    Get PDF
    Actas de las Quintas Jornadas Imagen, Cultura y Tecnología celebradas del 3 al 5 de julio de 2006 en la Universidad Carlos III de Madri

    Adopción y uso de sistemas de organización del conocimiento específicos de dominio: análisis y evaluación de factores limitantes

    Get PDF
    Los sistemas de organización del conocimiento (KOS – “Knowledge Organization Systems”) son una herramienta de gran ayuda de cara a la clasificación, organización y localización de información. La construcción de un KOS parte de una serie de términos, cuya selección en la mayor parte de los casos atiende a un dominio específico. Sobre estos términos se establecen distintas relaciones, como podría ser una relación jerárquica o una relación de equivalencia. La forma más elemental de uso de KOS consiste en valerse de los términos que los componen como palabras clave, mientras que las relaciones existentes permiten desarrollar funcionalidades avanzadas empleadas en áreas como la inteligencia artificial o la web semántica, entre otras. Los usuarios pueden beneficiarse de esta información de manera consciente mediante el empleo de interfaces que permiten operar con los términos y relaciones de un KOS, ya sea de manera textual o visual. La investigación relativa al desarrollo de estas interfaces tiene un largo recorrido y múltiples estudios muestran las potenciales ventajas que ofrecen para el usuario final. Sin embargo, a nivel práctico, su uso no está extendido en este sentido, contradiciendo los beneficios que resultan a nivel teórico. El presente trabajo persigue indagar en algunas de las posibles causas de este desuso y contribuir aportando metodologías que permitan evaluar su impacto, proporcionando información de utilidad para modificar un KOS de forma que se potencie su uso

    Características textuales como medida cualitativa de la Información en la generación semiautomática de tesauros

    Get PDF
    El objetivo del GTI es la generación semiautomática de tesauros mediante el análisis de un corpus. Tras ensayar distintos métodos de clasificación de la información, desde co-ocurrencia de términos a redes neuronales, se mostró necesaria la creación de nuevos indicadores que aportasen información adicional a la ya suministrada por el tesauro. La presentación de estos indicadores, y su previsible potencial, es la meta de la presente comunicación. El objetivo es reaprovechar el gran volumen de datos necesarios para realizar la clasificación y emplearlos en dos campos distintos: por un lado la validación del tesauro y por otro la creación de indicadores que nos indiquen a-priori la creatividad del texto dentro de nuestro corpus. La estructuración y etiquetado previo del texto parecen en estas circunstancias un paso necesario para poder estudiar posteriormente el resultado del conjunto de parámetros medidos en el set de documentos. La novedad se estudia desde un enfoque multidimensional: análisis lingüístico y del formato de los textos, estudio del tesauro generado, y la creación de indicadores ad-hoc. Al tiempo, se miden distintos parámetros en el tesauro para validar el tesauro autogenerado. Para el análisis matemático de los datos, se usan análisis multivariante y de las componentes principales. Una evaluación del programa está actualmente en curso

    Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes

    Get PDF
    Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y delitos futuros. No obstante, debido a la velocidad con la que se generan datos e información en la última década, las técnicas de análisis tradicional han resultado en baja productividad y en un uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y específicamente desde las ciencias de la computación, se vienen realizado múltiples intentos para ayudar a identificar y obtener la información más importante dentro de estos grandes volúmenes de datos. Hasta el momento los estudios previos realizados para este dominio, abarcan desde la predicción del lugar de un delito utilizando data numérica, hasta la identificación de nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la creación de una herramienta de extracción de información para noticias relacionadas al dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de extracción e información, y (3) Elaboración de una interfaz de programación de aplicaciones para el consumo del modelo desarrollado. Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.Tesi

    La recuperación documental de la imagen fotográfica: perspectiva tecnológica y documental

    Get PDF
    Actas de las Primeras Jornadas Imagen, Cultura y Tecnología celebradas del 1 al 5 de julio de 2002 en la Universidad Carlos III de Madri

    Lenguajes documentales

    Get PDF
    342 p. Libro electrónicoEste módulo nos introduce en los procesos documentales, que se llevan a cabo en archivos, bibliotecas y centros de documentación. Estos procesos se conocen como cadena documental. Itinerario�de�estudio El módulo empieza con una tabla que describe esta cadena. Acto seguido se analiza cada una de las fases y subfases y se aplican a los tres tipos principales de servicios de información: archivos, bibliotecas y centros de documentación, comentando las particularidades de cada uno. Finalmente se sitúan los lenguajes documentales, que son el cuerpo central de esta asignatura dentro de la cadena

    El Sistema integrado LISNET en las bibliotecas de la Universidad Nacional de Ingeniería: descripción y análisis

    Get PDF
    El documento digital no refiere asesorAborda la experiencia del sistema LISNET, desarrollado por el Centro de Cómputo de la Universidad Nacional de Ingeniería a fin de establecer criterios que sirvan de apoyo a las instituciones que se encuentran en el proceso de selección de un sistema integrado para sus bibliotecas y el establecimiento de recomendaciones a los responsables del proyecto. En la actualidad es evidente mencionar que el avance de la ciencia y tecnología sumado a un mercado de información más exigente y competitivo, ha suscitado que las unidades de información (bibliotecas, archivos, etc.) opten principalmente por sumarse a la innovación e implementación de novedosas herramientas tecnológicas para la gestión de todos sus actividades y procesos. Además de establecer redes cooperativas que permitan un mayor alcance hacia la comunidad. La noción de bibliotecas digitales (bibliotecas electrónicas o virtuales), entendida como la suma de fuentes híbridas, sistemas de metadatos tales como catálogos y tesauros, herramientas online, soporte humano y un ambiente adaptado dentro del cual la información es proporcionada, ha sido bastante difundida; como consecuencia, ha determinado el crecimiento del proceso de automatización en bibliotecas y centros de información.Trabajo de suficiencia profesiona
    corecore