17 research outputs found

    Service Cloud for information retrieval from multiple origins

    Get PDF
    One of the main intents of all digital libraries is to provide wide access to academic resources. Several tools and techniques are available to achieve this goal, some of them focus on harvest and storage of resources while others on retrieval and presentation. The heterogeneity of protocols, metadata formats and storage mechanisms generates a set of isolated datasources, which can be separately accessed by custom protocols and which usually contain only one part of the available information. This project suggests a solution for digital libraries based in a hybrid combination of software tools. The solution makes the procedure easier of information retrieval from heterogeneous datasources (OAI-PMH data provider, web services, z39.50, local repository, etc.) that can be queried from an arbitrary number of interfaces (OPAC, web services, z39.50, etc). Each of these entry points represent an unified view of the whole, which allows to easily interoperate across the interfaces and to collect, organize and return the results to the user that made the request. The development of this solution is based on the configuration of a set of special purpose tools. Additionally a set of adapters or drivers have been created, to allow the interoperability from and to each of the mentioned tools. The following tools have been considered so far in this project: an OAI harvester for harvesting bibliographic resources in any metadata format, Solr servers to index and retrieve information efficiently, a public OPAC, and finally a federated metasearch engine which works over the SRU/SRW and z39.50 standards. It is also possible to include other tools, which enables the opportunity add new services and data sources, without redesigning existing interfaces. Concepts developed along this work have been put into practice inside the Intellectual Creation Dissemination Service of La Plata National University. This initiative copes with a wide range of services for professors, researchers and students, such as: assisted search and provision of academic material in ISTEC and some non-ISTEC libraries, management and exposure of the institutional repository through OAI-PMH, public website to expose local and external resources (obtained via OAI-PMH) and harvesting of resources housed in academic units libraries of the University.Servicio de Difusión de la Creación Intelectual (SEDICI

    Arquitectura ETL para la recolección de metadatos

    Get PDF
    Digital repositories acting as resource aggregators typically face different challenges, roughly classified in three main categories: extraction, improvement and storage. The first category comprises issues related to dealing with different resource collection protocols: OAI-PMH, web-crawling, webservices, etc and their representation: XML, HTML, database tuples, unstructured documents, etc. The second category comprises information improvements based on controlled vocabularies, specific date formats, correction of malformed data, etc. Finally, the third category deals with the destination of downloaded resources: unification into a common database, sorting by certain criteria, etc. This paper proposes an ETL architecture for designing a software application that provides a comprehensive solution to challenges posed by a digital repository as resource aggregator. Design and implementation aspects considered during the development of this tool are described, focusing especially on architecture highlights.Servicio de Difusión de la Creación Intelectual (SEDICI

    Control de integridad y calidad en repositorios DSpace

    Get PDF
    Este trabajo describe 2 vías de extensión sobre el módulo de curation de Dspace. En primer lugar se describe un conjunto de curation tasks orientadas a analizar y reportar distintos aspectos asociados a la calidad de los datos y a brindar un soporte adicional a las tareas de preservación sobre el repositorio por medio de chequeos de integridad y de generación de nuevos metadatos. En segundo lugar se plantea la modificación de la estrategia de ejecución de curation tasks provisto por DSpace, en pos de minimizar su impacto en la performance de la aplicación, y flexibilizar los criterios de selección de recursos a procesar. A continuación se mencionan curation tasks que serán consideradas en este trabajo: ● chequeo de enlaces web a documentos alojados en servidores externos al repositorio, configurable; ● chequeo de metadatos conectados con autoridades (o vocabularios controlados) dentro o fuera del repositorio, para chequeo de integridad en los datos; ● chequeo de archivos cargados en el repositorio, asegurando que todos los recursos cuenten con un archivo asociado bajo las normas y políticas del repositorio; ● control de metadatos obligatorios, según el tipo de documento; ● control del dominio de metadatos, de acuerdo a tipos primitivos como ser fecha, número, texto, etc; ● generación de metadatos de preservación a partir de los archivos asociados a los recursos (ej.: software con el que se realizó el archivo, con su correspondiente versión, versión del formato, nivel de compresión utilizado, etc); ● testeo y posterior reporte de recursos a partir de condiciones lógicas sobre metadatos y archivos, utilizando un lenguaje de expresión simple. Actualmente las curation tasks se ejecutan sobre todos los ítems de una colección, una comunidad o incluso el repositorio completo, sin interrupciones y de manera secuencial. Esta estrategia de selección y ejecución genera una elevada demanda de recursos sobre el servidor que aloja el repositorio durante todo el tiempo de ejecución de los procesos de curation tasks, degradando la performance del mismo. Además, cuando se incluye más de una tarea en una misma orden de ejecución, éstas se ejecutan de forma secuencial, es decir, una tarea no puede iniciar su ejecución hasta tanto la tarea anterior no haya finalizado completamente. De aquí que en este trabajo se propone una nueva estrategia para la selección de los recursos a procesar y dos nuevas estrategias de ejecución de curation tasks: ● estrategia de selección de recursos a procesar en base a una expresión lógica configurable (ej.: seleccionar recursos según el valor de su metadato dc.type); ● estrategia de ejecución por lotes incrementales en pos de disminuir el impacto de la ejecución de las curation tasks sobre el sistema; ● cambio en la forma de ejecución secuencial a fin de obtener un avance uniforme a nivel de recursos en el procesamiento, en lugar de un avance a nivel de curation tasks. Hacia el final de este trabajo se mencionan otras posibles curation tasks, haciendo especial hincapié en las dificultades de implementación y la utilidad de las mismas en lo que respecta a la calidad de los metadatos y archivos, y a la preservación de los recursos. Entre estas tareas se pueden destacar un mecanismo de diagnóstico de archivos plausibles de ser o no preservados, un proceso de detección de recursos duplicados, una tarea de inferencia de relaciones entre recursos, de extracción de bibliografía a partir del texto completo, entre otras.Servicio de Difusión de la Creación Intelectual (SeDiCI

    DSpace como herramienta para un repositorio de documentos administrativos en la Universidad Nacional Experimental del Táchira

    Get PDF
    Los repositorios de documentos digitales administrativos permiten a una organización o institución gestionar su producción de manera automatizada. Este artículo tiene como objetivo describir, grosso modo, una propuesta para implementar un Repositorio de Documentos Administrativos en la Universidad Nacional Experimental del Táchira (REDAUNET) mediante la herramienta DSpace. La metodología para desarrollar la propuesta incluyó: a) un diagnóstico en la Universidad a través de un cuestionario electrónico para conocer qué y cómo se preservan los documentos administrativos; y, b) el diseño del repositorio para la catalogación y preservación de los documentos a partir del software Dspace, adecuado con las leyes del estado venezolano y la normativa de la Universidad. Los resultados indican que el REDAUNET cuenta con seis tipos de documentos administrativos (actas, constancias, memorandos, oficios, resoluciones y jurídicos) que contienen metadatos para identificar y localizar dichos documentos correctamente. Asimismo, se generó una documentación para la instalación, mantenimiento y desarrollo de la plataforma de software REDAUNET. Este artículo constituirá un aporte al área de repositorios digitales, sobre todo, en el ámbito administrativo y será un modelo para que las instituciones gestionen y preserven sus documentos.Servicio de Difusión de la Creación Intelectual (SEDICI

    El uso de repositorios y su importancia para la educación en Ingeniería

    Get PDF
    Los repositorios institucionales son depósitos de archivos digitales de diferentes tipologías para accederlos, difundirlos y preservarlos. Este artículo tiene como propósito explicar la importancia de los repositorios en el ámbito académico de la Ingeniería como una manera de democratizar el conocimiento por parte de los docentes, investigadores y alumnos para contribuir al desarrollo social y humano. Estos repositorios, enmarcados generalmente en la iniciativa Open Access, permiten asegurar el acceso libre y abierto (sin restricciones legales y económicas) a los diferentes sectores de la sociedad y de esa manera puedan hacer uso de los servicios que ofrecen. Finalmente, los repositorios están evolucionando en el ámbito académico y científico, y las diferentes disciplinas de la Ingeniería deben prepararse para brindar un conjunto de servicios a través de esos sistemas para la sociedad de hoy y del futuro.Institutional repositories are deposits of different types of digital files for access, disseminate and preserve them. This paper aims to explain the importance of repositories in the academic field of engineering as a way to democratize knowledge by teachers, researchers and students to contribute to social and human development. These repositories, usually framed in the Open Access Initiative, allow to ensure access free and open (unrestricted legal and economic) to different sectors of society and, thus, can make use of the services they offer. Finally, that repositories are evolving in the academic and scientific, and different disciplines of engineering should be prepared to provide a range of services through these systems to society of today and tomorrow.Servicio de Difusión de la Creación Intelectual (SEDICI

    El uso de repositorios y su importancia para la educación en Ingeniería

    Get PDF
    Los repositorios institucionales son depósitos de archivos digitales de diferentes tipologías para accederlos, difundirlos y preservarlos. Este artículo tiene como propósito explicar la importancia de los repositorios en el ámbito académico de la Ingeniería como una manera de democratizar el conocimiento por parte de los docentes, investigadores y alumnos para contribuir al desarrollo social y humano. Estos repositorios, enmarcados generalmente en la iniciativa Open Access, permiten asegurar el acceso libre y abierto (sin restricciones legales y económicas) a los diferentes sectores de la sociedad y de esa manera puedan hacer uso de los servicios que ofrecen. Finalmente, los repositorios están evolucionando en el ámbito académico y científico, y las diferentes disciplinas de la Ingeniería deben prepararse para brindar un conjunto de servicios a través de esos sistemas para la sociedad de hoy y del futuro.Institutional repositories are deposits of different types of digital files for access, disseminate and preserve them. This paper aims to explain the importance of repositories in the academic field of engineering as a way to democratize knowledge by teachers, researchers and students to contribute to social and human development. These repositories, usually framed in the Open Access Initiative, allow to ensure access free and open (unrestricted legal and economic) to different sectors of society and, thus, can make use of the services they offer. Finally, that repositories are evolving in the academic and scientific, and different disciplines of engineering should be prepared to provide a range of services through these systems to society of today and tomorrow.Servicio de Difusión de la Creación Intelectual (SEDICI

    The Benefits of Model-Driven Development in Institutional Repositories

    Get PDF
    Los Repositorios Institucionales (RI) se han consolidado en las instituciones en las áreas científicas y académicas, así lo demuestran los directorios de repositorios existentes de acceso abierto y en los depósitos diarios de artículos o documentos realizados por diferentes vías, tales como el autoarchivo por parte de los usuarios registrados y las catalogaciones por parte de los bibliotecarios. Los sistemas RI se basan en diversos modelos conceptuales, por lo que en este trabajo se realiza un relevamiento bibliográfico del Desarrollo de Software Dirigido por Modelos (MDD) en los sistemas y aplicaciones para los RI con el propósito de exponer los beneficios de la aplicación del MDD en los RI. El MDD es un paradigma de construcción de software que asigna a los modelos un rol central y activo bajo el cual se derivan modelos que van desde los más abstractos a los concretos, este proceso se realiza a través de transformaciones sucesivas. Este paradigma proporciona un marco de trabajo que permite a los interesados compartir sus puntos de vista y manipular directamente las representaciones de las entidades de este dominio. Por ello, se presentan los beneficios agrupados según los actores que están presentes, a saber, desarrolladores, dueños de negocio y expertos del dominio. En conclusión, estos beneficios ayudan a que todo el entorno del dominio de los RI se concentre en implementaciones de software más formales, generando una consolidación de tales sistemas, donde los principales beneficiarios serán los usuarios finales a través de los múltiples servicios que son y serán ofrecidos por estos sistemas.The Institutional Repositories (IR) have been consolidated into the institutions in scientific and academic areas, as shown by the directories existing open access repositories and the deposits daily of articles made by different ways, such as by self-archiving of registered users and the cataloging by librarians. IR systems are based on various conceptual models, so in this paper a bibliographic survey Model-Driven Development (MDD) in systems and applications for RI in order to expose the benefits of applying MDD in IR. The MDD is a paradigm for building software that assigns a central role models and active under which derive models ranging from the most abstract to the concrete, this is done through successive transformations. This paradigm provides a framework that allows interested parties to share their views and directly manipulate representations of the entities of this domain. Therefore, the benefits are grouped by actors that are present, namely, developers, business owners and domain experts. In conclusion, these benefits help make more formal software implementations, resulting in a consolidation of such systems, where the main beneficiaries are the end users through the services are offered.Servicio de Difusión de la Creación Intelectual (SEDICI

    Interoperabilidad entre el Repositorio Institucional y servicios en línea en la Universidad Nacional de La Plata

    Get PDF
    La Universidad Nacional de La Plata tiene como objetivo prioritario la difusión de todo el conocimiento generado en la institución, a fin de devolver a la sociedad parte del esfuerzo invertido en la Universidad pública. Para alcanzar este objetivo se han generado diversas iniciativas desde la gestión, la creación de nuevos servicios y la implementación de nuevas líneas de investigación y desarrollo para potenciar tales servicios. El Servicio de Difusión de la Creación Intelectual es el Repositorio Institucional central de la UNLP, y posee en la actualidad todo tipo de materiales científicos y académicos producidos desde la Universidad, incluyendo artículos de revistas científicas, publicaciones en congresos, tesis de posgrado, tesinas, normativas y ordenanzas, libros y libros electrónicos, documentos de audio, materiales educativos, y fotografías de piezas de museos, entre otros. Este repositorio institucional, el mayor de la Argentina y uno de los principales de América Latina, posee un rol central en la difusión de la producción intelectual de la UNLP y en la coordinación con otros servicios y desarrollos, entre los que se destacan el Portal de Revistas de la UNLP, soportado por el software Open Journal Systems, y el Portal de Congresos de la UNLP, soportado por el software Open Conference Systems. En este trabajo se detallan los distintos mecanismos que se han implementado desde la Universidad Nacional de La Plata para facilitar la interacción entre su repositorio institucional SEDICI -construido sobre el software Dspace- y estos portales, evitar la duplicación de esfuerzos y maximizar la difusión abierta del conocimiento. Dichos mecanismos incluyen desarrollos tecnológicos como la utilización de diversos protocolos (RSS/Atom, Sword, OAI-PMH) para establecer un camino unificado de comunicación entre los sistemas, o el desarrollo de plugins que permiten exportar la información desde las herramientas de gestión de producción académica, en un formato comprensible por otros sistemas. Todo esto, además, involucra el establecimiento de flujos de trabajo entre los equipos de personas que conforman los distintos servicios, con la finalidad de obtener un mecanismo unificado que contemple los métodos y las herramientas para exportar los datos e incorporarlos al repositorio. Finalmente, en este trabajo se incluyen otros esfuerzos generados tanto desde el SEDICI como desde la presidencia de la Universidad para asegurar la preservación de toda la producción intelectual y brindar nuevos mecanismos para maximizar la visibilidad de estos documentos científicos y académicos. Esto abarca a otros actores y direcciones de esta institución tales como la Editorial de la Universidad (EDULP), la Dirección de Educación a Distancia (EAD) y la Radio Universidad.La Plata National University (UNLP, Universidad Nacional de La Plata) has as priority objective the dissemination of all knowledge generated in the institution, in order to return to the society part of the efforts invested in the public University. To that end, different initiatives have been launched, along with new services as well as research and development projects to foster these services. The Intellectual Creation Dissemination Service (SEDICI, Servicio de Difusión de la Creación Intelectual) is the UNLP Institutional Repository, and holds different classes of scientific and academic materials produced inside the University, including journal articles, conferences' publications, theses, ordinances, books, e-books and audio-documents. This institutional repository, the largest one in Argentina and one of the largest ones in Latin America, possesses a central role in the dissemination of UNLP’s intellectual production and in the coordination with other projects and services such as UNLP’s Journals Portal, supported by OJS, and UNLP’s Conferences Portal, supported by OCS. In this article we explain the different mechanisms implemented from UNLP to ease the interaction between its institutional repository, SEDICI - supported by Dspace - and those portals, to avoid efforts duplication, and to maximize an open and free knowledge dissemination. Such mechanisms include technological developments based on different protocols (such as RSS/Atom, Sword, OAI-PMH) to establish an unified way of communication between systems, and the development of plugins that enable administrators to export information from the different tools in a format that could be understood by other systems. These involve the establishing of workflows among workgroups of the different services too, with the objective of building a unified mechanism that contemplates the methods and tools used to export/import data fomr and to the repository. In addition, other efforts driven from SEDICI as well as the University presidency are also mentioned in this document. These efforts seek to ensure the preservation of all intellectual production while they provide new mechanisms to maximize the visibility of the scientific and academic documents. Other actors and directions from the UNLP are also involved in such efforts, like the Publishing House EDULP, the Distance Education Direction (EAD), and the University Radio.Servicio de Difusión de la Creación Intelectual (SEDICI

    ISTEC Library Linkage network: future vision in the context of Open Access environment

    Get PDF
    Esta Iniciativa está integrada por un conjunto de instituciones de ISTEC que brindan servicios bibliográficos, compartiendo los acervos presentes enbibliográficos, compartiendo los acervos presentes en sus bibliotecas. Las instituciones que integran LIBLINK realizan desarrollos y proyectos para manejar mejor la información con el objetivo de generar conocimiento y con ello mejorar la educación y generar más y mejores recursos humanos. Esta Iniciativa apoya el movimiento Open Access.Servicio de Difusión de la Creación Intelectual (SEDICI

    SeDiCI - Desafíos y experiencias en la vida de un repositorio digital

    Get PDF
    Desde su creación en el año 2003, el Servicio de Difusión de la Creación Intelectual ha afrontado diversas dificultades que han influido directa o indirectamente en su desarrollo y crecimiento. En este documento se presentan algunas de estas experiencias, describiendo en cada caso el problema, su contexto y las vías de acción tomadas para superarlo. Adicionalmente se describen algunas de las diferentes líneas de investigación y desarrollo actuales, orientadas a expandir y mejorar los servicios proporcionados a la comunidad de usuarios. De ahí que el objetivo principal de este trabajo sea exponer la experiencia adquirida, con la intención de que resulte de utilidad para aquellas instituciones que se encuentren en el proceso de creación de sus propios repositorios.Since its creation in the year 2003, the Intellectual Creation Dissemination Service has faced up many difficulties. Thus the initiative has been directly and indirectly affected during its development and growth. This work presents some of these experiencies, describing problems, context and solution approaches. This document also describes some of the new and most recent challenges and the current research and development trends, which are oriented to improve and extend the services provided by SeDiCI. The main purpose of this document is to share the lived experiences with this project, which may be useful to other institutions working on their own digital repositories.Servicio de Difusión de la Creación Intelectual (SEDICI
    corecore