21 research outputs found

    All Near Neighbor GraphWithout Searching

    Get PDF
    Given a collection of n objects equipped with a distance function d(·, ·), the Nearest Neighbor Graph (NNG) consists in finding the nearest neighbor of each object in the collection. Without an index the total cost of NNG is quadratic. Using an index the cost would be sub-quadratic if the search for individual items is sublinear. Unfortunately, due to the so called curse of dimensionality the indexed and the brute force methods are almost equally inefficient. In this paper we present an efficient algorithm to build the Near Neighbor Graph (nNG), that is an approximation of NNG, using only the index construction, without actually searching for objects.Facultad de Informátic

    Recuperación de información en grandes volúmenes de datos

    Get PDF
    Actualmente han surgido una cantidad de nuevos repositorios de información, en los cuales los datos son no estructurados y no se adaptan fácilmente al modelo re- lacional. Esto se debe tanto a la evolución de las tecnologías de información y comunicación, como a la gran cantidad y variedad de información disponible en formato digital. Estos diferentes tipos de datos tales como texto libre, imágenes, audio, video, secuencias biológicas de ADN o proteínas, entre otros; o bien no pueden ser fácilmente estucturados en claves y registros, o bien tal estructuración carece de sentido práctico, restringiendo de antemano los diversos tipos de consultas que se pueden requerir sobre ellos. Todo esto deja en evidencia la necesidad de procesar grandes conjuntos de datos, para obtener información útil a partir de ellos. El objetivo de cualquier sistema de recuperación de información es obtener, desde una base de datos, lo que podría ser útil o relevante para el usuario a partir de una consulta. Para ello se utiliza alguna estructura de almacenamiento sobre dichos datos (índice), diseñadas especialmente para ese propósito, que permita responder a la consulta de manera eficiente.Eje: Base de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic

    Contribuciones a las bases de datos no convencionales

    Get PDF
    El advenimiento de las ciencias de la computación a todos los ámbitos de la vida moderna, ha exigido el desarrollo de aplicaciones que satisfagan los requerimientos de distintos tipos de usuarios, desde campos muy dispares, adaptándose a todo tipo de exigencias para lograr un alcance masivo. Claramente, esto implica lograr manipular eficientemente datos no convencionales muy disímiles como: huellas digitales, imágenes, audio, secuencias de ADN, texto, video, etc. Como las soluciones tradicionales no suelen hacer frente a tales requerimientos, es necesario utilizar depósitos especializados y búsquedas no exactas sobre estos tipos de datos. Además de proveer una respuesta rápida y adecuada a dichas demandas, es necesario un uso eficiente del espacio disponible, y al considerar bases de datos masivas, las estructuras en particular serán estructuras de datos con I/O eficiente. Las Bases de Datos Métricas son uno de los modelos generales en los cuales se pueden utilizar estructuras de datos especializadas que contemplen estos aspectos. Los lenguajes de consulta no siempre poseen el poder expresivo necesario para reflejar las consultas consideradas de interés. Así, nuestra investigación pretende contribuir a consolidar este nuevo modelo de bases de datos desde varias perspectivas.Eje: Bases de datos y Minería de datos.Red de Universidades con Carreras en Informática (RedUNCI

    Recuperación eficiente de datos en bases de datos masivas

    Get PDF
    Los sistemas de información actuales necesitan realizar búsquedas eficientes sobre diferentes tipos de datos, tales como texto libre, audio, video, secuencias de ADN, etc. Dada una consulta, el objetivo de un sistema de recuperación de información es obtener lo que podría ser útil o relevante para el usuario, en general usando una estructura de almacenamiento especialmente diseñada para responderla de manera eficiente. Así, nuestra línea de investigación tiene como principal objetivo desarrollar herramientas eficientes para sistemas de información sobre bases de datos masivas, conteniendo datos multimedia. Con este fin, se investigan nuevas técnicas que soporten la interacción con el usuario, nuevas estructuras de datos (índices) capaces de manipular eficientemente datos multimedia y que permitan manejar bases de datos masivas de este tipo de datos.Eje: Bases de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Recuperación eficiente de datos en bases de datos masivas

    Get PDF
    Los sistemas de información actuales necesitan realizar búsquedas eficientes sobre diferentes tipos de datos, tales como texto libre, audio, video, secuencias de ADN, etc. Dada una consulta, el objetivo de un sistema de recuperación de información es obtener lo que podría ser útil o relevante para el usuario, en general usando una estructura de almacenamiento especialmente diseñada para responderla de manera eficiente. Así, nuestra línea de investigación tiene como principal objetivo desarrollar herramientas eficientes para sistemas de información sobre bases de datos masivas, conteniendo datos multimedia. Con este fin, se investigan nuevas técnicas que soporten la interacción con el usuario, nuevas estructuras de datos (índices) capaces de manipular eficientemente datos multimedia y que permitan manejar bases de datos masivas de este tipo de datos.Eje: Bases de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Recuperación eficiente de datos en bases de datos multimedia

    Get PDF
    Los sistemas de información necesitan realizar de manera eficiente la búsqueda de los datos a través de estructuras de almacenamiento. Dicha búsqueda consiste en obtener los elementos que cumplen una serie de condiciones. En general, es tan difícil para los usuarios que intentan recuperar información multimedia poder especificar claramente sus intereses, o las condiciones a cumplir, a través de una consulta bien definida, como para los diseñadores del sistema decidir qué características de los objetos multimedia pueden ser relevantes. Dada una consulta, el objetivo de un sistema de recuperación de información es obtener lo que podría ser útil o relevante para el usuario, en general usando un índice especialmente diseñado para responder eficientemente la consulta. Así, nuestra línea de investigación tiene como principal objetivo desarrollar herramientas eficientes para la recuperación de información multimedia. Se investigan nuevas técnicas que soporten la interacción con el usuario, nuevas estructuras de datos (índices) capaces de manipular eficientemente datos multimedia y que permitan manejar grandes volúmenes de este tipo de datos.Eje: Bases de Datos y Minería de DatosRed de Universidades con Carreras en Informática (RedUNCI

    Preface

    Get PDF
    7th International Conference on Similarity Search and Applications (SISAP).\ud Los Cabos, México. 29-31 october 2014

    Decomposability of DiSAT for Index Dynamization

    Get PDF
    The Distal Spatial Approximation Tree (DiSAT) is one of the most competitive indexes for exact proximity searching. The absence of parameters, the most salient feature, makes the index a suitable choice for a practitioner. The most serious drawback is the static nature of the index, not allowing further insertions once it is built. On the other hand, there is an old approach from Bentley and Saxe (BS) allowing the dynamization of decomposable data structures. The only requirement is to provide a decomposition operation. This is precisely our contribution, we define a decomposition operation allowing the application of the BS technique. The resulting data structure is competitive against the static counterparts.Facultad de Informátic

    All Near Neighbor GraphWithout Searching

    Get PDF
    Given a collection of n objects equipped with a distance function d(·, ·), the Nearest Neighbor Graph (NNG) consists in finding the nearest neighbor of each object in the collection. Without an index the total cost of NNG is quadratic. Using an index the cost would be sub-quadratic if the search for individual items is sublinear. Unfortunately, due to the so called curse of dimensionality the indexed and the brute force methods are almost equally inefficient. In this paper we present an efficient algorithm to build the Near Neighbor Graph (nNG), that is an approximation of NNG, using only the index construction, without actually searching for objects.Facultad de Informátic

    Recuperación de datos para el procesamiento de datos masivos

    Get PDF
    La gran cantidad y variedad de información disponible en formato digital, junto con la evolución de las tecnologías de información y comunicación, han llevado al surgimiento de nuevos repositorios no estructurados de información, en los cuales los datos son no estructurados y no se adaptan fácilmente al modelo relacional. A tipos de datos tales como texto libre, imágenes, audio, video, secuencias biológicas de ADN o proteínas, entre otros; no se los puede estructurar fácilmente en claves y registros (tanto manual como computacionalmente), o tal estructuración carece de sentido practico , y restringe de antemano los tipos de consultas que luego se pueden realizar. Por lo tanto, es cada vez mas evidente en la actualidad la necesidad de procesar grandes conjuntos de datos, para obtener información útil a partir de ellos. Así, dada una base de datos y una consulta, el objetivo de un sistema de recuperación de información es obtener, desde la base de datos, lo que podría ser útil o relevante para el usuario, usando alguna estructura de almacenamiento sobre dichos datos que permita responder a la consulta de manera eficiente. Estas estructuras necesitan ser diseñadas especialmente para ese propósito.Eje: Bases de Datos y Minería de Datos.Red de Universidades con Carreras en Informátic
    corecore