722 research outputs found

    MiniTREC: un modelo de aprendizaje basado en proyectos para la asignatura de Recuperación de Información

    Get PDF
    La asignatura de Recuperación de información es una asignatura de nueva impartición dentro de la mención de Computación del Grado en Ingeniería Informática en la Universidad de Zaragoza. La complejidad e interrelación de los contenidos de esta asignatura dificulta la realización de prácticas en las que los alumnos prueben los modelos y algoritmos descritos en teoría. Para facilitar la asimilación de los conceptos teóricos se ha decidido utilizar una metodología de aprendizaje basado en proyectos. Este artículo describe la experiencia de aplicación de dicha metodología, los resultados obtenidos, problemas encontrados y áreas de mejora.SUMMARY -- Information Retrieval is a new course of the Computer Science Degree Program in Computing Engineering Studies at the University of Zaragoza. The complexity and interrelation of this course’s contents makes difficult the definition of practices that allow students to test the models and algorithms described in theory classes. To facilitate the understanding of concepts, it was decided to use a project based learning methodology. This paper describes the application experience of this methodology, the results obtained, problems found and areas of improvement

    Tracing the origins of incunabula through the automatic identification of fonts in digitised documents

    Get PDF
    Incunabula are the texts printed mainly during the second half of 15th century that are a key cultural element in a revolutionary period of the history and evolution of the book and the printing. In these books, the identification of their origin largely affects its academic, cultural, patrimonial, and economical value. This paper proposes a process to automate the identification of the origin of a digitised incunable document using the Proctor/Haebler method, a commonly established procedure in the field. This process has been validated with a selected dataset obtained from the incunabula collection at the digital repository of the University of Zaragoza

    Automatic reconstruction of itineraries from descriptive texts

    Get PDF
    Esta tesis se inscribe dentro del marco del proyecto PERDIDO donde los objetivos son la extracción y reconstrucción de itinerarios a partir de documentos textuales. Este trabajo se ha realizado en colaboración entre el laboratorio LIUPPA de l' Université de Pau et des Pays de l' Adour (France), el grupo de Sistemas de Información Avanzados (IAAA) de la Universidad de Zaragoza y el laboratorio COGIT de l' IGN (France). El objetivo de esta tesis es concebir un sistema automático que permita extraer, a partir de guías de viaje o descripciones de itinerarios, los desplazamientos, además de representarlos sobre un mapa. Se propone una aproximación para la representación automática de itinerarios descritos en lenguaje natural. Nuestra propuesta se divide en dos tareas principales. La primera pretende identificar y extraer de los textos describiendo itinerarios información como entidades espaciales y expresiones de desplazamiento o percepción. El objetivo de la segunda tarea es la reconstrucción del itinerario. Nuestra propuesta combina información local extraída gracias al procesamiento del lenguaje natural con datos extraídos de fuentes geográficas externas (por ejemplo, gazetteers). La etapa de anotación de informaciones espaciales se realiza mediante una aproximación que combina el etiquetado morfo-sintáctico y los patrones léxico-sintácticos (cascada de transductores) con el fin de anotar entidades nombradas espaciales y expresiones de desplazamiento y percepción. Una primera contribución a la primera tarea es la desambiguación de topónimos, que es un problema todavía mal resuelto dentro del reconocimiento de entidades nombradas (Named Entity Recognition - NER) y esencial en la recuperación de información geográfica. Se plantea un algoritmo no supervisado de georreferenciación basado en una técnica de clustering capaz de proponer una solución para desambiguar los topónimos los topónimos encontrados en recursos geográficos externos, y al mismo tiempo, la localización de topónimos no referenciados. Se propone un modelo de grafo genérico para la reconstrucción automática de itinerarios, donde cada nodo representa un lugar y cada arista representa un camino enlazando dos lugares. La originalidad de nuestro modelo es que además de tener en cuenta los elementos habituales (caminos y puntos del recorrido), permite representar otros elementos involucrados en la descripción de un itinerario, como por ejemplo los puntos de referencia visual. Se calcula de un árbol de recubrimiento mínimo a partir de un grafo ponderado para obtener automáticamente un itinerario bajo la forma de un grafo. Cada arista del grafo inicial se pondera mediante un método de análisis multicriterio que combina criterios cualitativos y cuantitativos. El valor de estos criterios se determina a partir de informaciones extraídas del texto e informaciones provenientes de recursos geográficos externos. Por ejemplo, se combinan las informaciones generadas por el procesamiento del lenguaje natural como las relaciones espaciales describiendo una orientación (ej: dirigirse hacia el sur) con las coordenadas geográficas de lugares encontrados dentro de los recursos para determinar el valor del criterio ``relación espacial''. Además, a partir de la definición del concepto de itinerario y de las informaciones utilizadas en la lengua para describir un itinerario, se ha modelado un lenguaje de anotación de información espacial adaptado a la descripción de desplazamientos, apoyándonos en las recomendaciones del consorcio TEI (Text Encoding and Interchange). Finalmente, se ha implementado y evaluado las diferentes etapas de nuestra aproximación sobre un corpus multilingüe de descripciones de senderos y excursiones (francés, español, italiano)

    MiniTREC: un modelo de aprendizaje basado en proyectos para la asignatura de Recuperación de Información

    Get PDF
    La asignatura de Recuperación de información es una asignatura de nueva impartición dentro de la mención de Computación del Grado en Ingeniería Informática en la Universidad de Zaragoza. La complejidad e interrelación de los contenidos de esta asignatura dificulta la realización de prácticas en las que los alumnos prueben los modelos y algoritmos descritos en teoría. Para facilitar la asimilación de los conceptos teóricos se ha decidido utilizar una metodología de aprendizaje basado en proyectos. Este artículo describe la experiencia de aplicación de dicha metodología, los resultados obtenidos, problemas encontrados y áreas de mejora.Information Retrieval is a new course of the Computer Science Degree Program in Computing Engineering Studies at the University of Zaragoza. The complexity and interrelation of this course’s contents makes difficult the definition of practices that allow students to test the models and algorithms described in theory classes. To facilitate the understanding of concepts, it was decided to use a project based learning methodology. This paper describes the application experience of this methodology, the results obtained, problems found and areas of improvement.Este trabajo ha sido realizado como parte del proyecto PIIDUZ_13_171 de la Universidad de Zaragoza y financiado por el Gobierno de España a través del proyecto TIN2012-37826-C02-01

    Discrete Global Grid Systems with quadrangular cells as reference frameworks for the current generation of Earth observation data cubes

    Get PDF
    Discrete Global Grid Systems are spatial reference frameworks that associate information to multi-resolution grids of uniquely identified cells; they are proposed as mechanisms to facilitate the efficient integration of heterogeneous spatial data. They could provide an excellent reference system for Earth observation data cubes, technological infrastructures that provide analysis-ready access to Earth Observation big data, as long as they can be made compatible with them. In this paper, we demonstrate that this is currently feasible without requiring new technological developments. We show how a Discrete Global Grid System with quadrangular cells, rHEALPix, and an existing data cube platform, Open Data Cube, can be integrated without loosing the advantages of having all the data in a Discrete Global Grid System, while keeping a straightforward access to all of the analysis tools provided by an Earth Observation Data Cube

    Aggregation-based information retrieval system for geospatial data catalogs

    Get PDF
    Geospatial data catalogs enable users to discover and access geographical information. Prevailing solutions are document oriented and fragment the spatial continuum of the geospatial data into independent and disconnected resources described through metadata. Due to this, the complete answer for a query may be scattered across multiple resources, making its discovery and access more difficult. This paper proposes an improved information retrieval process for geospatial data catalogs that aggregates the search results by identifying the implicit spatial/thematic relations between the metadata records of the resources. These aggregations are constructed in such a way that they match better the user query than each resource individually

    Agricultural recommendation system for crop protection

    Get PDF
    Pests in crops produce important economic loses all around the world. To deal with them without damaging people or the environment, governments have established strict legislation and norms describing the products and procedures of use. However, since these norms frequently change to reflect scientific and technological advances, it is needed to perform a frequent review of affected norms in order to update pest related information systems. This is not an easy task because they are usually human-oriented, so intensive manual labour is required. To facilitate the use of this information, this work proposes the construction of a recommendation system that facilitates the identification of pests and the selection of suitable treatments. The core of this system is an ontology that models the interactions between crops, pests and treatments

    A code for direct numerical simulation of turbulent boundary layers at high Reynolds numbers in BG/P supercomputers

    Get PDF
    A new high-resolution code for the direct numerical simulation of a zero pressure gradient turbulent boundary layers over a flat plate has been developed. Its purpose is to simulate a wide range of Reynolds numbers from Reθ = 300 to 6800 while showing a linear weak scaling up to 32,768 cores in the BG/P architecture. Special attention has been paid to the generation of proper inflow boundary conditions. The results are in good agreement with existing numerical and experimental data sets

    Análisis y Metodología de Ensayo de Confort y Condiciones de Carga de Material Móvil Ferroviario Remolcado

    Get PDF
    El objetivo de este estudio es realizar un análisis de las condiciones de carga y el confort del material móvil ferroviario remolcado y, posteriormente, desarrollar una metodología de ensayo válida. Se han estudiado, por un lado, las condiciones de carga a las que está sometido un bogie de un vehículo ferroviario y, por otro, el confort para un vehículo ferroviario equipado con el bogie en cuestión. Para ello se ha realizado un análisis de los requisitos de la normativa relacionada (sobre todo las UIC 515-4 y UIC 518), una especificación del protocolo de ensayo a seguir y una ejecución y análisis de los resultados obtenidos. Esta metodología de estudio ha dado muy buen resultado a la hora de determinar, por un lado, los esfuerzos sufridos por un bogie en diferentes condiciones de carga y, por otro, las condiciones de confort de un material móvil ferroviario remolcado tanto en tara como en condiciones de carga máxima, en una circulación normal y variando su velocidad. Las herramientas software desarrolladas son muy flexibles y permiten su extensión a cualquier tipo de estudio de este tipo
    corecore