10 research outputs found

    Accessing very high dimensional spaces in parallel

    Get PDF
    Access methods are a fundamental tool on Information Retrieval. However, most of these methods suffer the problem known as the curse of dimensionality when they are applied to objects with very high dimensionality representation spaces, such as text documents. In this paper we introduce a new parallel access method that uses several graphs as distributed index structure and a kNN search algorithm. Two parallel versions of the search method are presented, one based on master鈥搒lave scheme and the other based on a pipeline. A thorough experimental analysis on different datasets shows that our method can process efficiently large flows of queries, compete with other parallel algorithms and obtain at the same time very high quality results.This research has been supported by the CICYT project TIN2014-53495-R of the Ministerio de Econom铆a y Competitividad

    Procesamiento de consultas en motores de b煤squeda: dise帽o y evaluaci贸n en t茅rminos de consumo de energ铆a

    Get PDF
    Actualmente los centros de datos accedidos por los buscadores web junto con las computadoras personales consumen el 10% de la energ铆a mundial, y de ese porcentaje aproximadamente el 2% es consumido s贸lo por los buscadores y sus centros de datos. Sin embargo, es de esperar que en los pr贸ximos a帽os estos porcentajes se incrementen en un 30% o 40% debido a que el tama帽o de la Web tiende a duplicarse cada ocho meses, la cantidad de usuarios que se conectan a 茅sta sigue creciendo y los buscadores satisfacen la creciente demanda incrementando el hardware utilizado. En este trabajo se presentan los objetivos y los desaf铆os de una l铆nea de investigaci贸n que abarca los problemas de consumo de energ铆a que deben solucionar actualmente los grandes centros de c贸mputos y de datos, en particular los buscadores Web.Eje: Procesamiento distribuido y paraleloRed de Universidades con Carreras en Inform谩tica (RedUNCI

    Procesamiento de consultas en motores de b煤squeda: dise帽o y evaluaci贸n en t茅rminos de consumo de energ铆a

    Get PDF
    Actualmente los centros de datos accedidos por los buscadores web junto con las computadoras personales consumen el 10% de la energ铆a mundial, y de ese porcentaje aproximadamente el 2% es consumido s贸lo por los buscadores y sus centros de datos. Sin embargo, es de esperar que en los pr贸ximos a帽os estos porcentajes se incrementen en un 30% o 40% debido a que el tama帽o de la Web tiende a duplicarse cada ocho meses, la cantidad de usuarios que se conectan a 茅sta sigue creciendo y los buscadores satisfacen la creciente demanda incrementando el hardware utilizado. En este trabajo se presentan los objetivos y los desaf铆os de una l铆nea de investigaci贸n que abarca los problemas de consumo de energ铆a que deben solucionar actualmente los grandes centros de c贸mputos y de datos, en particular los buscadores Web.Eje: Procesamiento distribuido y paraleloRed de Universidades con Carreras en Inform谩tica (RedUNCI

    Programaci贸n paralela en sistemas h铆bridos

    Get PDF
    Con la aparici贸n de las CPU multi-cores (o Chiplevel- Multi-Processor -CMP-), es importante el desarrollo de las t茅cnicas que exploten las ventajas de las CMP para acelerar las aplicaciones paralelas que poseen una gran demanda de c贸mputo paralelo. En particular, las aplicaciones que requieren de un gran poder computacional de los recursos disponibles, es esencial poder desarrollar estrategias y algoritmos que aprovechen el uso adecuado del hardware. Esto es especialmente cr铆tico cuando se consideran sistemas o aplicaciones en las que los requerimientos ingresan en intervalos variables. En este trabajo se propone el desarrollo de t茅cnicas h铆bridas basadas en el uso de MPI para la comunicaci贸n entre procesadores y OpenMP para la comunicaci贸n entre cores de un mismo procesador. OpenMP ha sido desarrollado para tomar ventaja de las facilidades multithreading de los nodos CMP.Eje: Procesamiento Distribuido y ParaleloRed de Universidades con Carreras en Inform谩tica (RedUNCI

    Programaci贸n paralela en sistemas h铆bridos

    Get PDF
    Con la aparici贸n de las CPU multi-cores (o Chiplevel- Multi-Processor -CMP-), es importante el desarrollo de las t茅cnicas que exploten las ventajas de las CMP para acelerar las aplicaciones paralelas que poseen una gran demanda de c贸mputo paralelo. En particular, las aplicaciones que requieren de un gran poder computacional de los recursos disponibles, es esencial poder desarrollar estrategias y algoritmos que aprovechen el uso adecuado del hardware. Esto es especialmente cr铆tico cuando se consideran sistemas o aplicaciones en las que los requerimientos ingresan en intervalos variables. En este trabajo se propone el desarrollo de t茅cnicas h铆bridas basadas en el uso de MPI para la comunicaci贸n entre procesadores y OpenMP para la comunicaci贸n entre cores de un mismo procesador. OpenMP ha sido desarrollado para tomar ventaja de las facilidades multithreading de los nodos CMP.Eje: Procesamiento Distribuido y ParaleloRed de Universidades con Carreras en Inform谩tica (RedUNCI

    Consultas sobre espacios m茅tricos en paralelo

    Get PDF
    En este trabajo se proponen estrategias eficientes y escalables de procesamiento paralelo de consultas, sobre 铆ndices distribuidos para bases de datos compuestas de un gran n煤mero de objetos en espacios m茅tricos. Las estrategias est谩n dise帽adas para satisfacer los requerimientos de las m谩quinas de b煤squeda para la Web, que operan a una gran tasa de consultas por unidad de tiempo, lo cual en este trabajo se logra mediante la combinaci贸n de las siguientes estrategias: (a) Particionado del 铆ndice de tal manera de reducir el n煤mero de procesadores involucrados en la soluci贸n de cada consulta, (b) reducci贸n del n煤mero de objetos de la base de datos que son directamente comparados con cada consulta, (c) planificaci贸n de consultas para balancear la carga de los procesadores, (d) asignaci贸n equitativa de recursos de hardware y software a las consultas siendo resueltas, y (e) reducci贸n de latencias mediante una combinaci贸n de los modelos s铆ncrono y as铆ncrono de computaci贸n paralela. La eficiencia y escalabilidad de las estrategias propuestas se eval煤an utilizando diferentes bases de datos y clusters de computadores, y los resultados muestran que 茅stas logran mejor desempe帽o que estrategias alternativas presentadas en la literatura.Eje: Concurso de tesisRed de Universidades con Carreras en Inform谩tica (RedUNCI

    Hybrid architecture for metric space searches

    Get PDF
    Every day, new technologies are developed to combine the facilities arranged for shared memory systems with the facilities that provide distributed memory systems. This paper proposes a hybrid system that enables communication between threads running in a shared memory environment and a cluster of computers. To do this we use specific directives provided by MPI to solve a problem of similarity search on metric spaces .This work is part of a larger project that deals with improving query searches over high dimensional spaces, managing large volumes of data, reducing the number of distance evaluations and query response times. While the proposal of this work may be generalized and used for other problems, the results show that the proposed hybrid algorithm allows a significant improvement. This work is part of a larger project that deals with improving the execution of parallel algorithms using a hybrid architecture. The goal is to take advantage of the features and facilities provided by the new parallel architectures that combine distributed and shared memory systems. The former allows to solve large scale problems while the second allows better use of resources.Presentado en el XI Workshop Procesamiento Distribuido y Paralelo (WPDP)Red de Universidades con Carreras en Inform谩tica (RedUNCI

    Consultas sobre espacios m茅tricos en paralelo

    Get PDF
    El trabajo desarrollado en esta tesis tuvo como objetivo el dise帽o, implementaci贸n y evaluaci贸n de un 铆ndice distribuido para objetos en espacios m茅tricos y su respectiva estrategia de procesamiento paralelo de consultas para m谩quinas de b煤squeda.Tesis doctoral de la Facultad de Ciencias F铆sicomatem谩ticas y Naturales (Universidad Nacional de San Luis). Grado alcanzado: Doctor en Ciencias de la Computaci贸n. Director de tesis: Mart铆n Mauricio; co-director: Marcela Printista.Red de Universidades con Carreras en Inform谩tica (RedUNCI

    Distributed Sparse Spatial Selection Indexes

    No full text
    Searching for similar objects in metric-space databases can be efficiently solved by using index data structures. A number of alternative sequential indexes have been proposed in the literature. This paper proposes the parallelization of a recent pivot-based index data structure which can efficiently accommodate on-line updates and reduces the number of object-to-object comparisons during searches. We present algorithms for index construction and query processing
    corecore