467 research outputs found
Propuesta de procedimiento para la construcción semiautomática de tesauros en Bibliotecas Universitarias
Objetivo Se proponen procedimientos de índole teóricos en la indización, y a la vez introduciéndose en parcelas de las Ciencias de la Computación para resolver problemas de la Red TIC del Proyecto VLIR desde una óptica multidisciplinar, dada las características imponen el reto de intentar desarrollar cualquier proceso normativo en el terreno de la indización para un entorno complejo y pluridisciplinar, siendo la primera vez que se asume un trabajo en Ciencias de la Información en la Universidad Central “Marta Abreu” de Las Villas (UCLV). Diseño/Metodología/Enfoque se utilizaron las técnicas de origen matemático: la Ley de Zip, TF-IDF, N-grams y Stop World Elimination, aportando un enfoque mixto predominantemente cuantitativo. La descripción sirve de guía para la construcción de léxicos especializados, al incluir los mecanismos de construcción basados en las reglas exigidas a nivel internacional. Resultados/Discusión: Desde el diagnóstico de los Procesos de Indización en las Bibliotecas asociadas a la Red TIC del Proyecto VLIR, se aplicaron métodos y técnicas en la recopilación de información permitieron obtener resultados relacionados a la experiencia en los procesos de indización y construcción de tesauros en las diversas universidades del país. Conclusiones: La creación de un procedimiento que proporcione la transformación de los vocabularios controlados en un lenguaje interoperable, facilita la indización y la recuperación eficiente de la información. Originalidad/Valor: El impacto social de uso estriba en que al contener datos estandarizados en formato SKOS, las plataformas que usa y desarrolla la red podrán interpretar con otras plataformas con fines similares dando visibilidad a la ciencia de la Red TIC
Tesauros y ontologías para las fotografías
Actas de las Quintas Jornadas Imagen, Cultura y Tecnología celebradas del 3 al 5 de julio de 2006 en la Universidad Carlos III de Madri
Adopción y uso de sistemas de organización del conocimiento específicos de dominio: análisis y evaluación de factores limitantes
Los sistemas de organización del conocimiento (KOS – “Knowledge Organization Systems”) son una herramienta de gran ayuda de cara a la clasificación, organización y localización de información. La construcción de un KOS parte de una serie de términos, cuya selección en la mayor parte de los casos atiende a un dominio específico. Sobre estos términos se establecen distintas relaciones, como podría ser una relación jerárquica o una relación de equivalencia. La forma más elemental de uso de KOS consiste en valerse de los términos que los componen como palabras clave, mientras que las relaciones existentes permiten desarrollar funcionalidades avanzadas empleadas en áreas como la inteligencia artificial o la web semántica, entre otras. Los usuarios pueden beneficiarse de esta información de manera consciente mediante el empleo de interfaces que permiten operar con los términos y relaciones de un KOS, ya sea de manera textual o visual. La investigación relativa al desarrollo de estas interfaces tiene un largo recorrido y múltiples estudios muestran las potenciales ventajas que ofrecen para el usuario final. Sin embargo, a nivel práctico, su uso no está extendido en este sentido, contradiciendo los beneficios que resultan a nivel teórico. El presente trabajo persigue indagar en algunas de las posibles causas de este desuso y contribuir aportando metodologías que permitan evaluar su impacto, proporcionando información de utilidad para modificar un KOS de forma que se potencie su uso
Características textuales como medida cualitativa de la Información en la generación semiautomática de tesauros
El objetivo del GTI es la generación semiautomática de tesauros mediante el análisis de un corpus. Tras ensayar distintos métodos de clasificación de la información, desde co-ocurrencia de términos a redes neuronales, se mostró necesaria la creación de nuevos indicadores que aportasen información adicional a la ya suministrada por el tesauro. La presentación de estos indicadores, y su previsible potencial, es la meta de la presente comunicación. El objetivo es reaprovechar el gran volumen de datos necesarios para realizar la clasificación y emplearlos en dos campos distintos: por un lado la validación del tesauro y por otro la creación de indicadores que nos indiquen a-priori la creatividad del texto dentro de nuestro corpus. La estructuración y etiquetado previo del texto parecen en estas circunstancias un paso necesario para poder estudiar posteriormente el resultado del conjunto de parámetros medidos en el set de documentos. La novedad se estudia desde un enfoque multidimensional: análisis lingüístico y del formato de los textos, estudio del tesauro generado, y la creación de indicadores ad-hoc. Al tiempo, se miden distintos parámetros en el tesauro para validar el tesauro autogenerado. Para el análisis matemático de los datos, se usan análisis multivariante y de las componentes principales. Una evaluación del programa está actualmente en curso
Extracción de información para la generación de reportes estructurados a partir de noticias peruanas relacionadas a crímenes
Actualmente, múltiples fuerzas policiales y agencias de inteligencia han decidido enfocar
parte de sus esfuerzos en la recolección de todo tipo de información sobre crímenes. Esto
con el objetivo de poder analizar los datos disponibles y utilizar los resultados de esta
tarea para la mejora de procesos actuales, e incluso, para la prevención de ataques y
delitos futuros.
No obstante, debido a la velocidad con la que se generan datos e información en la última
década, las técnicas de análisis tradicional han resultado en baja productividad y en un
uso ineficiente de recursos. Es por esta razón, que desde el campo de la informática, y
específicamente desde las ciencias de la computación, se vienen realizado múltiples
intentos para ayudar a identificar y obtener la información más importante dentro de estos
grandes volúmenes de datos.
Hasta el momento los estudios previos realizados para este dominio, abarcan desde la
predicción del lugar de un delito utilizando data numérica, hasta la identificación de
nombres y entidades en descripciones textuales. En este contexto, este trabajo propone la
creación de una herramienta de extracción de información para noticias relacionadas al
dominio criminal peruano. Buscando identificar automáticamente culpables, víctimas y
locaciones mediante los siguientes pasos: (1) Procesamiento y generación de un conjunto
de datos en base a noticias criminales, (2) Implementación y validación de algoritmos de
extracción e información, y (3) Elaboración de una interfaz de programación de
aplicaciones para el consumo del modelo desarrollado.
Los resultados obtenidos evidencian que el enfoque utilizado, basado en dependencias
sintácticas y reconocimiento de entidades nombradas, es exitoso. Además, se espera que en el futuro se puedan mejorar los resultados obtenidos con técnicas de procesamiento de lenguaje natural para dominios con pocos recursos.Tesi
La recuperación documental de la imagen fotográfica: perspectiva tecnológica y documental
Actas de las Primeras Jornadas Imagen, Cultura y Tecnología celebradas del 1 al 5 de julio de 2002 en la Universidad Carlos III de Madri
Lenguajes documentales
342 p. Libro electrónicoEste módulo nos introduce en los procesos documentales, que se llevan a cabo
en archivos, bibliotecas y centros de documentación. Estos procesos se conocen
como cadena documental.
Itinerario�de�estudio
El módulo empieza con una tabla que describe esta cadena. Acto seguido se
analiza cada una de las fases y subfases y se aplican a los tres tipos principales
de servicios de información: archivos, bibliotecas y centros de documentación,
comentando las particularidades de cada uno. Finalmente se sitúan los
lenguajes documentales, que son el cuerpo central de esta asignatura dentro
de la cadena
El Sistema integrado LISNET en las bibliotecas de la Universidad Nacional de Ingeniería: descripción y análisis
El documento digital no refiere asesorAborda la experiencia del sistema LISNET, desarrollado por el Centro de Cómputo de la Universidad Nacional de Ingeniería a fin de establecer criterios que sirvan de apoyo a las instituciones que se encuentran en el proceso de selección de un sistema integrado para sus bibliotecas y el establecimiento de recomendaciones a los responsables del proyecto. En la actualidad es evidente mencionar que el avance de la ciencia y tecnología sumado a un mercado de información más exigente y competitivo, ha suscitado que las unidades de información (bibliotecas, archivos, etc.) opten principalmente por sumarse a la innovación e implementación de novedosas herramientas tecnológicas para la gestión de todos sus actividades y procesos. Además de establecer redes cooperativas que permitan un mayor alcance hacia la comunidad. La noción de bibliotecas digitales (bibliotecas electrónicas o virtuales), entendida como la suma de fuentes híbridas, sistemas de metadatos tales como catálogos y tesauros, herramientas online, soporte humano y un ambiente adaptado dentro del cual la información es proporcionada, ha sido bastante difundida; como consecuencia, ha determinado el crecimiento del proceso de automatización en bibliotecas y centros de información.Trabajo de suficiencia profesiona
- …