8 research outputs found
Indexing Metric Spaces for Exact Similarity Search
With the continued digitalization of societal processes, we are seeing an
explosion in available data. This is referred to as big data. In a research
setting, three aspects of the data are often viewed as the main sources of
challenges when attempting to enable value creation from big data: volume,
velocity and variety. Many studies address volume or velocity, while much fewer
studies concern the variety. Metric space is ideal for addressing variety
because it can accommodate any type of data as long as its associated distance
notion satisfies the triangle inequality. To accelerate search in metric space,
a collection of indexing techniques for metric data have been proposed.
However, existing surveys each offers only a narrow coverage, and no
comprehensive empirical study of those techniques exists. We offer a survey of
all the existing metric indexes that can support exact similarity search, by i)
summarizing all the existing partitioning, pruning and validation techniques
used for metric indexes, ii) providing the time and storage complexity analysis
on the index construction, and iii) report on a comprehensive empirical
comparison of their similarity query processing performance. Here, empirical
comparisons are used to evaluate the index performance during search as it is
hard to see the complexity analysis differences on the similarity query
processing and the query performance depends on the pruning and validation
abilities related to the data distribution. This article aims at revealing
different strengths and weaknesses of different indexing techniques in order to
offer guidance on selecting an appropriate indexing technique for a given
setting, and directing the future research for metric indexes
A gpu-based implementation for range queries on spaghettis data structure
Similarity search in a large collection of stored objects in a metric database has become a most interesting problem. The Spaghettis is an efficient metric data structure to index metric spaces. However, for real applications processing large volumes of generated data, query response times can be high enough. In these cases, it is necessary to apply mechanisms in order to significantly reduce the average query time. In this sense, the parallelization of metric structures is an interesting field of research. The recent appearance of GPUs for general purpose computing platforms offers powerful parallel processing capabilities. In this paper we propose a GPU-based implementation for Spaghettis metric structure. Firstly, we have adapted Spaghettis structure to GPU-based platform. Afterwards, we have compared both sequential and GPU-based implementation to analyse the performance, showing significant improvements in terms of time reduction, obtaining values of speed-up close to 10.
Keywords: Databases ? similarity search ? metric spaces ? algorithms ? data structures ? parallel processing ? GPU ? CUD
Paralelizaci贸n de estructuras m茅tricas para b煤squedas por similaridad en servidores web
La b usqueda por similaridad consiste en recuperar todos aquellos objetos dentro de una base de datos que sean parecidos o relevantes a una determinada consulta. Este concepto tiene una amplia gama de aplicaciones en areas como bases de datos multimediales, reconocimiento de patrones, miner a de datos, recuperaci on de informaci on, etc.
La posibilidad de fusionar dos l neas de investigaci on independiente, como es, el desarrollo de estructuras de datos para b usquedas por similitud y la necesidad de procesar grandes vol umenes de datos usando computaci on paralela, permitir a la utilizaci on de estas nuevas estructuras en aplicaciones reales.
El presente art culo describe la l nea de investigaci on conjunta de un grupo de investigadores de la Universidad de Magallanes y de la Universidad Nacional de la Patagonia Austral a trav es del programa de investigaci on \Paralelizaci on de Estructuras de Datos y Algoritmos para la Recuperaci on de Informaci on", el cual permitir a el dise~no, implementaci on y evaluaci on de estructuras m etricas paralelas.Eje: Procesamiento Concurrente, Paralelo y DistribuidoRed de Universidades con Carreras en Inform谩tica (RedUNCI
Paralelizaci贸n de estructuras m茅tricas para b煤squedas por similaridad en servidores web
La b usqueda por similaridad consiste en recuperar todos aquellos objetos dentro de una base de datos que sean parecidos o relevantes a una determinada consulta. Este concepto tiene una amplia gama de aplicaciones en areas como bases de datos multimediales, reconocimiento de patrones, miner a de datos, recuperaci on de informaci on, etc.
La posibilidad de fusionar dos l neas de investigaci on independiente, como es, el desarrollo de estructuras de datos para b usquedas por similitud y la necesidad de procesar grandes vol umenes de datos usando computaci on paralela, permitir a la utilizaci on de estas nuevas estructuras en aplicaciones reales.
El presente art culo describe la l nea de investigaci on conjunta de un grupo de investigadores de la Universidad de Magallanes y de la Universidad Nacional de la Patagonia Austral a trav es del programa de investigaci on \Paralelizaci on de Estructuras de Datos y Algoritmos para la Recuperaci on de Informaci on", el cual permitir a el dise~no, implementaci on y evaluaci on de estructuras m etricas paralelas.Eje: Procesamiento Concurrente, Paralelo y DistribuidoRed de Universidades con Carreras en Inform谩tica (RedUNCI
Anales del XIII Congreso Argentino de Ciencias de la Computaci贸n (CACIC)
Contenido:
Arquitecturas de computadoras
Sistemas embebidos
Arquitecturas orientadas a servicios (SOA)
Redes de comunicaciones
Redes heterog茅neas
Redes de Avanzada
Redes inal谩mbricas
Redes m贸viles
Redes activas
Administraci贸n y monitoreo de redes y servicios
Calidad de Servicio (QoS, SLAs)
Seguridad inform谩tica y autenticaci贸n, privacidad
Infraestructura para firma digital y certificados digitales
An谩lisis y detecci贸n de vulnerabilidades
Sistemas operativos
Sistemas P2P
Middleware
Infraestructura para grid
Servicios de integraci贸n (Web Services o .Net)Red de Universidades con Carreras en Inform谩tica (RedUNCI
Anales del XIII Congreso Argentino de Ciencias de la Computaci贸n (CACIC)
Contenido:
Arquitecturas de computadoras
Sistemas embebidos
Arquitecturas orientadas a servicios (SOA)
Redes de comunicaciones
Redes heterog茅neas
Redes de Avanzada
Redes inal谩mbricas
Redes m贸viles
Redes activas
Administraci贸n y monitoreo de redes y servicios
Calidad de Servicio (QoS, SLAs)
Seguridad inform谩tica y autenticaci贸n, privacidad
Infraestructura para firma digital y certificados digitales
An谩lisis y detecci贸n de vulnerabilidades
Sistemas operativos
Sistemas P2P
Middleware
Infraestructura para grid
Servicios de integraci贸n (Web Services o .Net)Red de Universidades con Carreras en Inform谩tica (RedUNCI
CACIC 2015 : XXI Congreso Argentino de Ciencias de la Computaci贸n. Libro de actas
Actas del XXI Congreso Argentino de Ciencias de la Computaci贸n (CACIC 2015), realizado en Sede UNNOBA Jun铆n, del 5 al 9 de octubre de 2015.Red de Universidades con Carreras en Inform谩tica (RedUNCI