21 research outputs found
All Near Neighbor GraphWithout Searching
Given a collection of n objects equipped with a distance function d(·, ·), the Nearest Neighbor Graph (NNG) consists in finding the nearest neighbor of each object in the collection. Without an index the total cost of NNG is quadratic. Using an index the cost would be sub-quadratic if the search for individual items is sublinear. Unfortunately, due to the so called curse of dimensionality the indexed and the brute force methods are almost equally inefficient. In this paper we present an efficient algorithm to build the Near Neighbor Graph (nNG), that is an approximation of NNG, using only the index construction, without actually searching for objects.Facultad de Informátic
Recuperación de información en grandes volúmenes de datos
Actualmente han surgido una cantidad de nuevos repositorios de información, en los cuales los datos son no estructurados y no se adaptan fácilmente al modelo re- lacional. Esto se debe tanto a la evolución de las tecnologÃas de información y comunicación, como a la gran cantidad y variedad de información disponible en formato digital. Estos diferentes tipos de datos tales como texto libre, imágenes, audio, video, secuencias biológicas de ADN o proteÃnas, entre otros; o bien no pueden ser fácilmente estucturados en claves y registros, o bien tal estructuración carece de sentido práctico, restringiendo de antemano los diversos tipos de consultas que se pueden requerir sobre ellos. Todo esto deja en evidencia la necesidad de procesar grandes conjuntos de datos, para obtener información útil a partir de ellos.
El objetivo de cualquier sistema de recuperación de información es obtener, desde una base de datos, lo que podrÃa ser útil o relevante para el usuario a partir de una consulta. Para ello se utiliza alguna estructura de almacenamiento sobre dichos datos (Ãndice), diseñadas especialmente para ese propósito, que permita responder a la consulta de manera eficiente.Eje: Base de Datos y MinerÃa de Datos.Red de Universidades con Carreras en Informátic
Contribuciones a las bases de datos no convencionales
El advenimiento de las ciencias de la computación a todos los ámbitos de la vida moderna, ha exigido el desarrollo de aplicaciones que satisfagan los requerimientos de distintos tipos de usuarios, desde campos muy dispares, adaptándose a todo tipo de exigencias para lograr un alcance masivo. Claramente, esto implica lograr manipular eficientemente datos no convencionales muy disÃmiles como: huellas digitales, imágenes, audio, secuencias de ADN, texto, video, etc. Como las soluciones tradicionales no suelen hacer frente a tales requerimientos, es necesario utilizar depósitos especializados y búsquedas no exactas sobre estos tipos de datos.
Además de proveer una respuesta rápida y adecuada a dichas demandas, es necesario un uso eficiente del espacio disponible, y al considerar bases de datos masivas, las estructuras en particular serán estructuras de datos con I/O eficiente. Las Bases de Datos Métricas son uno de los modelos generales en los cuales se pueden utilizar estructuras de datos especializadas que contemplen estos aspectos. Los lenguajes de consulta no siempre poseen el poder expresivo necesario para reflejar las consultas consideradas de interés. AsÃ, nuestra investigación pretende contribuir a consolidar este nuevo modelo de bases de datos desde varias perspectivas.Eje: Bases de datos y MinerÃa de datos.Red de Universidades con Carreras en Informática (RedUNCI
Recuperación eficiente de datos en bases de datos masivas
Los sistemas de información actuales necesitan realizar búsquedas eficientes sobre diferentes tipos de datos, tales como texto libre, audio, video, secuencias de ADN, etc. Dada una consulta, el objetivo de un sistema de recuperación de información es obtener lo que podrÃa ser útil o relevante para el usuario, en general usando una estructura de almacenamiento especialmente diseñada para responderla de manera eficiente.
AsÃ, nuestra lÃnea de investigación tiene como principal objetivo desarrollar herramientas eficientes para sistemas de información sobre bases de datos masivas, conteniendo datos multimedia. Con este fin, se investigan nuevas técnicas que soporten la interacción con el usuario, nuevas estructuras de datos (Ãndices) capaces de manipular eficientemente datos multimedia y que permitan manejar bases de datos masivas de este tipo de datos.Eje: Bases de Datos y MinerÃa de DatosRed de Universidades con Carreras en Informática (RedUNCI
Recuperación eficiente de datos en bases de datos masivas
Los sistemas de información actuales necesitan realizar búsquedas eficientes sobre diferentes tipos de datos, tales como texto libre, audio, video, secuencias de ADN, etc. Dada una consulta, el objetivo de un sistema de recuperación de información es obtener lo que podrÃa ser útil o relevante para el usuario, en general usando una estructura de almacenamiento especialmente diseñada para responderla de manera eficiente.
AsÃ, nuestra lÃnea de investigación tiene como principal objetivo desarrollar herramientas eficientes para sistemas de información sobre bases de datos masivas, conteniendo datos multimedia. Con este fin, se investigan nuevas técnicas que soporten la interacción con el usuario, nuevas estructuras de datos (Ãndices) capaces de manipular eficientemente datos multimedia y que permitan manejar bases de datos masivas de este tipo de datos.Eje: Bases de Datos y MinerÃa de DatosRed de Universidades con Carreras en Informática (RedUNCI
Recuperación eficiente de datos en bases de datos multimedia
Los sistemas de información necesitan realizar de manera eficiente la búsqueda de los datos a través de estructuras de almacenamiento. Dicha búsqueda consiste en obtener los elementos que cumplen una serie de condiciones.
En general, es tan difÃcil para los usuarios que intentan recuperar información multimedia poder especificar claramente sus intereses, o las condiciones a cumplir, a través de una consulta bien definida, como para los diseñadores del sistema decidir qué caracterÃsticas de los objetos multimedia pueden ser relevantes. Dada una consulta, el objetivo de un sistema de recuperación de información es obtener lo que podrÃa ser útil o relevante para el usuario, en general usando un Ãndice especialmente diseñado para responder eficientemente la consulta.
AsÃ, nuestra lÃnea de investigación tiene como principal objetivo desarrollar herramientas eficientes para la recuperación de información multimedia. Se investigan nuevas técnicas que soporten la interacción con el usuario, nuevas estructuras de datos (Ãndices) capaces de manipular eficientemente datos multimedia y que permitan manejar grandes volúmenes de este tipo de datos.Eje: Bases de Datos y MinerÃa de DatosRed de Universidades con Carreras en Informática (RedUNCI
Preface
7th International Conference on Similarity Search and Applications (SISAP).\ud
Los Cabos, México. 29-31 october 2014
Decomposability of DiSAT for Index Dynamization
The Distal Spatial Approximation Tree (DiSAT) is one of the most competitive indexes for exact proximity searching. The absence of parameters, the most salient feature, makes the index a suitable choice for a practitioner. The most serious drawback is the static nature of the index, not allowing further insertions once it is built. On the other hand, there is an old approach from Bentley and Saxe (BS) allowing the dynamization of decomposable data structures. The only requirement is to provide a decomposition operation.
This is precisely our contribution, we define a decomposition operation allowing the application of the BS technique. The resulting data structure is competitive against the static counterparts.Facultad de Informátic
All Near Neighbor GraphWithout Searching
Given a collection of n objects equipped with a distance function d(·, ·), the Nearest Neighbor Graph (NNG) consists in finding the nearest neighbor of each object in the collection. Without an index the total cost of NNG is quadratic. Using an index the cost would be sub-quadratic if the search for individual items is sublinear. Unfortunately, due to the so called curse of dimensionality the indexed and the brute force methods are almost equally inefficient. In this paper we present an efficient algorithm to build the Near Neighbor Graph (nNG), that is an approximation of NNG, using only the index construction, without actually searching for objects.Facultad de Informátic
Recuperación de datos para el procesamiento de datos masivos
La gran cantidad y variedad de información disponible en formato digital, junto con la evolución de las tecnologÃas de información y comunicación, han llevado al surgimiento de nuevos repositorios no estructurados de información, en los cuales los datos son no estructurados y no se adaptan fácilmente al modelo relacional. A tipos de datos tales como texto libre, imágenes, audio, video, secuencias biológicas de ADN o proteÃnas, entre otros; no se los puede estructurar fácilmente en claves y registros (tanto manual como computacionalmente), o tal estructuración carece de sentido practico , y restringe de antemano los tipos de consultas que luego se pueden realizar. Por lo tanto, es cada vez mas evidente en la actualidad la necesidad de procesar grandes conjuntos de datos, para obtener información útil a partir de ellos.
AsÃ, dada una base de datos y una consulta, el objetivo de un sistema de recuperación de información es obtener, desde la base de datos, lo que podrÃa ser útil o relevante para el usuario, usando alguna estructura de almacenamiento sobre dichos datos que permita responder a la consulta de manera eficiente. Estas estructuras necesitan ser diseñadas especialmente para ese propósito.Eje: Bases de Datos y MinerÃa de Datos.Red de Universidades con Carreras en Informátic