10 research outputs found
Accessing very high dimensional spaces in parallel
Access methods are a fundamental tool on Information Retrieval. However,
most of these methods suffer the problem known as the curse of dimensionality when
they are applied to objects with very high dimensionality representation spaces, such
as text documents. In this paper we introduce a new parallel access method that uses
several graphs as distributed index structure and a kNN search algorithm. Two parallel
versions of the search method are presented, one based on master鈥搒lave scheme and
the other based on a pipeline. A thorough experimental analysis on different datasets
shows that our method can process efficiently large flows of queries, compete with
other parallel algorithms and obtain at the same time very high quality results.This research has been supported by the CICYT project TIN2014-53495-R of the
Ministerio de Econom铆a y Competitividad
Procesamiento de consultas en motores de b煤squeda: dise帽o y evaluaci贸n en t茅rminos de consumo de energ铆a
Actualmente los centros de datos accedidos por los buscadores web junto con las computadoras personales consumen el 10% de la energ铆a mundial, y de ese porcentaje aproximadamente el 2% es consumido s贸lo por los buscadores y sus centros de datos. Sin embargo, es de esperar que en los pr贸ximos a帽os estos porcentajes se incrementen en un 30% o 40% debido a que el tama帽o de la Web tiende a duplicarse cada ocho meses, la cantidad de usuarios que se conectan a 茅sta sigue creciendo y los buscadores satisfacen la creciente demanda incrementando el hardware utilizado.
En este trabajo se presentan los objetivos y los desaf铆os de una l铆nea de investigaci贸n que abarca los problemas de consumo de energ铆a que deben solucionar actualmente los grandes centros de c贸mputos y de datos, en particular los buscadores Web.Eje: Procesamiento distribuido y paraleloRed de Universidades con Carreras en Inform谩tica (RedUNCI
Procesamiento de consultas en motores de b煤squeda: dise帽o y evaluaci贸n en t茅rminos de consumo de energ铆a
Actualmente los centros de datos accedidos por los buscadores web junto con las computadoras personales consumen el 10% de la energ铆a mundial, y de ese porcentaje aproximadamente el 2% es consumido s贸lo por los buscadores y sus centros de datos. Sin embargo, es de esperar que en los pr贸ximos a帽os estos porcentajes se incrementen en un 30% o 40% debido a que el tama帽o de la Web tiende a duplicarse cada ocho meses, la cantidad de usuarios que se conectan a 茅sta sigue creciendo y los buscadores satisfacen la creciente demanda incrementando el hardware utilizado.
En este trabajo se presentan los objetivos y los desaf铆os de una l铆nea de investigaci贸n que abarca los problemas de consumo de energ铆a que deben solucionar actualmente los grandes centros de c贸mputos y de datos, en particular los buscadores Web.Eje: Procesamiento distribuido y paraleloRed de Universidades con Carreras en Inform谩tica (RedUNCI
Programaci贸n paralela en sistemas h铆bridos
Con la aparici贸n de las CPU multi-cores (o Chiplevel- Multi-Processor -CMP-), es importante el desarrollo de las t茅cnicas que exploten las ventajas de las CMP para acelerar las aplicaciones paralelas que poseen una gran demanda de c贸mputo paralelo.
En particular, las aplicaciones que requieren de un gran poder computacional de los recursos disponibles, es esencial poder desarrollar estrategias y algoritmos que aprovechen el uso adecuado del hardware. Esto es especialmente cr铆tico cuando se consideran sistemas o aplicaciones en las que los requerimientos ingresan en intervalos variables. En este trabajo se propone el desarrollo de t茅cnicas h铆bridas basadas en el uso de MPI para la comunicaci贸n entre procesadores y OpenMP para la comunicaci贸n entre cores de un mismo procesador.
OpenMP ha sido desarrollado para tomar ventaja de las facilidades multithreading de los nodos CMP.Eje: Procesamiento Distribuido y ParaleloRed de Universidades con Carreras en Inform谩tica (RedUNCI
Programaci贸n paralela en sistemas h铆bridos
Con la aparici贸n de las CPU multi-cores (o Chiplevel- Multi-Processor -CMP-), es importante el desarrollo de las t茅cnicas que exploten las ventajas de las CMP para acelerar las aplicaciones paralelas que poseen una gran demanda de c贸mputo paralelo.
En particular, las aplicaciones que requieren de un gran poder computacional de los recursos disponibles, es esencial poder desarrollar estrategias y algoritmos que aprovechen el uso adecuado del hardware. Esto es especialmente cr铆tico cuando se consideran sistemas o aplicaciones en las que los requerimientos ingresan en intervalos variables. En este trabajo se propone el desarrollo de t茅cnicas h铆bridas basadas en el uso de MPI para la comunicaci贸n entre procesadores y OpenMP para la comunicaci贸n entre cores de un mismo procesador.
OpenMP ha sido desarrollado para tomar ventaja de las facilidades multithreading de los nodos CMP.Eje: Procesamiento Distribuido y ParaleloRed de Universidades con Carreras en Inform谩tica (RedUNCI
Consultas sobre espacios m茅tricos en paralelo
En este trabajo se proponen estrategias eficientes y escalables de procesamiento paralelo de consultas, sobre 铆ndices distribuidos para bases de datos compuestas de un gran n煤mero de objetos en espacios m茅tricos. Las estrategias est谩n dise帽adas para satisfacer los requerimientos de las m谩quinas de b煤squeda para la Web, que operan a una gran tasa de consultas por unidad de tiempo, lo cual en este trabajo se logra mediante la combinaci贸n de las siguientes estrategias: (a) Particionado del 铆ndice de tal manera de reducir el n煤mero de procesadores involucrados en la soluci贸n de cada consulta, (b) reducci贸n del n煤mero de objetos de la base de datos que son directamente comparados con cada consulta, (c) planificaci贸n de consultas para balancear la carga de los procesadores, (d) asignaci贸n equitativa de recursos de hardware y software a las consultas siendo resueltas, y (e) reducci贸n de latencias mediante una combinaci贸n de los modelos s铆ncrono y as铆ncrono de computaci贸n paralela. La eficiencia y escalabilidad de las estrategias propuestas se eval煤an utilizando diferentes bases de datos y clusters de computadores, y los resultados muestran que 茅stas logran mejor desempe帽o que estrategias alternativas presentadas en la literatura.Eje: Concurso de tesisRed de Universidades con Carreras en Inform谩tica (RedUNCI
Hybrid architecture for metric space searches
Every day, new technologies are developed to combine the facilities arranged for shared memory systems with the facilities that provide distributed memory systems. This paper proposes a hybrid system that enables communication between threads running in a shared memory environment and a cluster of computers. To do this we use specific directives provided by MPI to solve a problem of similarity search on metric spaces .This work is part of a larger project that deals with improving query searches over high dimensional spaces, managing large volumes of data, reducing the number of distance evaluations and query response times. While the proposal of this work may be generalized and used for other problems, the results show that the proposed hybrid algorithm allows a significant improvement.
This work is part of a larger project that deals with improving the execution of parallel algorithms using a hybrid architecture. The goal is to take advantage of the features and facilities provided by the new parallel architectures that combine distributed and shared memory systems.
The former allows to solve large scale problems while the second allows better use of resources.Presentado en el XI Workshop Procesamiento Distribuido y Paralelo (WPDP)Red de Universidades con Carreras en Inform谩tica (RedUNCI
Consultas sobre espacios m茅tricos en paralelo
El trabajo desarrollado en esta tesis tuvo como objetivo el dise帽o, implementaci贸n y evaluaci贸n de un 铆ndice distribuido para objetos en espacios m茅tricos y su respectiva estrategia de procesamiento paralelo de consultas para m谩quinas de b煤squeda.Tesis doctoral de la Facultad de Ciencias F铆sicomatem谩ticas y Naturales (Universidad Nacional de San Luis). Grado alcanzado: Doctor en Ciencias de la Computaci贸n. Director de tesis: Mart铆n Mauricio; co-director: Marcela Printista.Red de Universidades con Carreras en Inform谩tica (RedUNCI
Distributed Sparse Spatial Selection Indexes
Searching for similar objects in metric-space databases can be efficiently solved by using index data structures. A number of alternative sequential indexes have been proposed in the literature. This paper proposes the parallelization of a recent pivot-based index data structure which can efficiently accommodate on-line updates and reduces the number of object-to-object comparisons during searches. We present algorithms for index construction and query processing