12 research outputs found

    Diversity in similarity joins

    Get PDF
    With the increasing ability of current applications to produce and consume more complex data, such as images and geographic information, the similarity join has attracted considerable attention. However, this operator does not consider the relationship among the elements in the answer, generating results with many pairs similar among themselves, which does not add value to the final answer. Result diversification methods are intended to retrieve elements similar enough to satisfy the similarity conditions, but also considering the diversity among the elements in the answer, producing a more heterogeneous result with smaller cardinality, which improves the meaning of the answer. Still, diversity have been studied only when applied to unary operations. In this paper, we introduce the concept of diverse similarity joins: a similarity join operator that ensures a smaller, more diversified and useful answers. The experiments performed on real and synthetic datasets show that our proposal allows exploiting diversity in similarity joins without diminish their performance whereas providing elements that cover the same data space distribution of the non-diverse answers.FAPESPCNPQCAPESRescuer (EU Commission Grant 614154 and CNPQ/MCTI Grant 490084/2013-3)International Conference on Similarity Search and Applications - SISAP (8. 2015 Glasgow

    Administraci贸n y recuperaci贸n de datos multimedia masivos

    Get PDF
    Dado el crecimiento sostenido en los 煤ltimos tiempos de la disponibilidad de diferentes tipos de datos multimedia, por el uso masivo de dispositivos que producen datos digitalizados, se ha vuelto necesario contar con grandes repositorios de datos no estructurados provenientes de distintas fuentes, los cuales son dif铆ciles de administrar bajo el modelo relacional de base de datos. Este crecimiento sostenido tanto de la cantidad de datos en formato digital disponible, como en la variedad de los mismos, ha ido acompa帽ado por la r谩pida evoluci贸n de las tecnolog铆as de la informaci贸n y comunicaci贸n. Al considerar tipos de datos tales como texto libre, im谩genes, audio, video, secuencias biol贸gicas de ADN o prote铆nas, entre otros, su administraci贸n y las distintas formas de recuperaci贸n de datos no se corresponden a las habituales y forzar una modelizaci贸n de los mismos no adecuada podr铆a restringir de antemano el tipo de operaciones que se puedan realizar sobre ellos. As铆, al considerar la administraci贸n y recuperaci贸n sobre grandes conjuntos de datos no estructurados, se hace evidente la necesidad de considerar nuevos modelos y herramientas para su administraci贸n y su indexaci贸n, considerando las operaciones de inter茅s. Adem谩s, como el objetivo de cualquier sistema de recuperaci贸n de informaci贸n es obtener informaci贸n 煤til para el usuario, mediante consultas a la base de datos, no s贸lo se deben soportar distintos tipos de consultas sino tambi茅n resolverlas de manera eficiente usando 铆ndices apropiados.Red de Universidades con Carreras en Inform谩tic

    Recuperaci贸n de datos e informaci贸n en bases de datos masivas

    Get PDF
    En la actualidad es cada vez m谩s evidente la necesidad de procesar grandes conjuntos de datos, de manera tal de poder obtener informaci贸n 煤til a partir de ellos. Sin embargo, la evoluci贸n de las tecnolog铆as de informaci贸n y comunicaci贸n, en conjunto con la gran cantidad y variedad de informaci贸n disponible digitalmente, han llevado en las 麓ultimas d茅cadas al surgimiento de nuevos dep贸sitos no estructurados de informaci贸n, en los cuales los datos que no se adaptan f谩cilmente al modelo relacional. A tipos de datos tales como texto libre, im谩genes, audio, video, secuencias biol贸gicas de ADN o prote铆nas, entre otros; no se los puede estructurar m谩s en claves y registros, o tal estructuraci贸n es muy dificultosa (tanto manual como computacionalmente), y restringe de antemano los tipos de consultas que luego se pueden realizar. Como muchas aplicaciones computacionales necesitan recuperar datos e informaci贸n desde estas grandes bases de datos conteniendo datos no estructurados, es necesario lograr eficiencia en formas m谩s sofisticadas de b煤squeda que la habitual sobre datos estucturados. As铆, dada una consulta, el objetivo de un sistema de recuperaci贸n de informaci贸n es obtener lo que podr铆a ser 煤til o relevante para el usuario, usando una estructura de almacenamiento especialmente dise帽ada para responderla eficientemente.Eje: Bases de Datos y Miner铆a de Datos.Red de Universidades con Carreras en Inform谩tic

    Recuperaci贸n de datos e informaci贸n en bases de datos masivas

    Get PDF
    En la actualidad es cada vez m谩s evidente la necesidad de procesar grandes conjuntos de datos, de manera tal de poder obtener informaci贸n 煤til a partir de ellos. Sin embargo, la evoluci贸n de las tecnolog铆as de informaci贸n y comunicaci贸n, en conjunto con la gran cantidad y variedad de informaci贸n disponible digitalmente, han llevado en las 麓ultimas d茅cadas al surgimiento de nuevos dep贸sitos no estructurados de informaci贸n, en los cuales los datos que no se adaptan f谩cilmente al modelo relacional. A tipos de datos tales como texto libre, im谩genes, audio, video, secuencias biol贸gicas de ADN o prote铆nas, entre otros; no se los puede estructurar m谩s en claves y registros, o tal estructuraci贸n es muy dificultosa (tanto manual como computacionalmente), y restringe de antemano los tipos de consultas que luego se pueden realizar. Como muchas aplicaciones computacionales necesitan recuperar datos e informaci贸n desde estas grandes bases de datos conteniendo datos no estructurados, es necesario lograr eficiencia en formas m谩s sofisticadas de b煤squeda que la habitual sobre datos estucturados. As铆, dada una consulta, el objetivo de un sistema de recuperaci贸n de informaci贸n es obtener lo que podr铆a ser 煤til o relevante para el usuario, usando una estructura de almacenamiento especialmente dise帽ada para responderla eficientemente.Eje: Bases de Datos y Miner铆a de Datos.Red de Universidades con Carreras en Inform谩tic

    Recuperaci贸n de datos para el procesamiento de datos masivos

    Get PDF
    La gran cantidad y variedad de informaci贸n disponible en formato digital, junto con la evoluci贸n de las tecnolog铆as de informaci贸n y comunicaci贸n, han llevado al surgimiento de nuevos repositorios no estructurados de informaci贸n, en los cuales los datos son no estructurados y no se adaptan f谩cilmente al modelo relacional. A tipos de datos tales como texto libre, im谩genes, audio, video, secuencias biol贸gicas de ADN o prote铆nas, entre otros; no se los puede estructurar f谩cilmente en claves y registros (tanto manual como computacionalmente), o tal estructuraci贸n carece de sentido practico , y restringe de antemano los tipos de consultas que luego se pueden realizar. Por lo tanto, es cada vez mas evidente en la actualidad la necesidad de procesar grandes conjuntos de datos, para obtener informaci贸n 煤til a partir de ellos. As铆, dada una base de datos y una consulta, el objetivo de un sistema de recuperaci贸n de informaci贸n es obtener, desde la base de datos, lo que podr铆a ser 煤til o relevante para el usuario, usando alguna estructura de almacenamiento sobre dichos datos que permita responder a la consulta de manera eficiente. Estas estructuras necesitan ser dise帽adas especialmente para ese prop贸sito.Eje: Bases de Datos y Miner铆a de Datos.Red de Universidades con Carreras en Inform谩tic

    Recuperaci贸n de datos para el procesamiento de datos masivos

    Get PDF
    La gran cantidad y variedad de informaci贸n disponible en formato digital, junto con la evoluci贸n de las tecnolog铆as de informaci贸n y comunicaci贸n, han llevado al surgimiento de nuevos repositorios no estructurados de informaci贸n, en los cuales los datos son no estructurados y no se adaptan f谩cilmente al modelo relacional. A tipos de datos tales como texto libre, im谩genes, audio, video, secuencias biol贸gicas de ADN o prote铆nas, entre otros; no se los puede estructurar f谩cilmente en claves y registros (tanto manual como computacionalmente), o tal estructuraci贸n carece de sentido practico , y restringe de antemano los tipos de consultas que luego se pueden realizar. Por lo tanto, es cada vez mas evidente en la actualidad la necesidad de procesar grandes conjuntos de datos, para obtener informaci贸n 煤til a partir de ellos. As铆, dada una base de datos y una consulta, el objetivo de un sistema de recuperaci贸n de informaci贸n es obtener, desde la base de datos, lo que podr铆a ser 煤til o relevante para el usuario, usando alguna estructura de almacenamiento sobre dichos datos que permita responder a la consulta de manera eficiente. Estas estructuras necesitan ser dise帽adas especialmente para ese prop贸sito.Eje: Bases de Datos y Miner铆a de Datos.Red de Universidades con Carreras en Inform谩tic

    XXI Workshop de Investigadores en Ciencias de la Computaci贸n - WICC 2019: libro de actas

    Get PDF
    Trabajos presentados en el XXI Workshop de Investigadores en Ciencias de la Computaci贸n (WICC), celebrado en la provincia de San Juan los d铆as 25 y 26 de abril 2019, organizado por la Red de Universidades con Carreras en Inform谩tica (RedUNCI) y la Facultad de Ciencias Exactas, F铆sicas y Naturales de la Universidad Nacional de San Juan.Red de Universidades con Carreras en Inform谩tic

    XXI Workshop de Investigadores en Ciencias de la Computaci贸n - WICC 2019: libro de actas

    Get PDF
    Trabajos presentados en el XXI Workshop de Investigadores en Ciencias de la Computaci贸n (WICC), celebrado en la provincia de San Juan los d铆as 25 y 26 de abril 2019, organizado por la Red de Universidades con Carreras en Inform谩tica (RedUNCI) y la Facultad de Ciencias Exactas, F铆sicas y Naturales de la Universidad Nacional de San Juan.Red de Universidades con Carreras en Inform谩tic

    XXIII Edici贸n del Workshop de Investigadores en Ciencias de la Computaci贸n : Libro de actas

    Get PDF
    Compilaci贸n de las ponencias presentadas en el XXIII Workshop de Investigadores en Ciencias de la Computaci贸n (WICC), llevado a cabo en Chilecito (La Rioja) en abril de 2021.Red de Universidades con Carreras en Inform谩tic

    XX Workshop de Investigadores en Ciencias de la Computaci贸n - WICC 2018 : Libro de actas

    Get PDF
    Actas del XX Workshop de Investigadores en Ciencias de la Computaci贸n (WICC 2018), realizado en Facultad de Ciencias Exactas y Naturales y Agrimensura de la Universidad Nacional del Nordeste, los d矛as 26 y 27 de abril de 2018.Red de Universidades con Carreras en Inform谩tica (RedUNCI
    corecore