116 research outputs found

    Consultas sobre espacios métricos en paralelo

    Get PDF
    El trabajo desarrollado en esta tesis tuvo como objetivo el diseño, implementación y evaluación de un índice distribuido para objetos en espacios métricos y su respectiva estrategia de procesamiento paralelo de consultas para máquinas de búsqueda.Tesis doctoral de la Facultad de Ciencias Físicomatemáticas y Naturales (Universidad Nacional de San Luis). Grado alcanzado: Doctor en Ciencias de la Computación. Director de tesis: Martín Mauricio; co-director: Marcela Printista.Red de Universidades con Carreras en Informática (RedUNCI

    Using parallel pivot vs. clustering-based techniques for web engines

    Get PDF
    Web Engines are a useful tool for searching information in the Web. But a great part of this information is non-textual and for that case a metric space is used. A metric space is a set where a notion of distance (called a metric) between elements of the set is defined. In this paper we present an efficient parallelization of a pivot-based method devised for this purpose which is called the Sparse Spatial Selection (SSS) strategy and we compare it with a clustering-based method, a parallel implementation of the Spatial Approximation Tree (SAT). We show that SAT compares favourably against the pivot data structures SSS. The experimental results were obtained on a highperformance cluster and using several metric spaces, that shows load balance parallel strategies for the SAT. The implementations are built upon the BSP parallel computing model, which shows efficient performance for this application domain and allows a precise evaluation of algorithms.VIII Workshop de Procesamiento Distribuido y ParaleloRed de Universidades con Carreras en Informática (RedUNCI

    Using parallel pivot vs. clustering-based techniques for web engines

    Get PDF
    Web Engines are a useful tool for searching information in the Web. But a great part of this information is non-textual and for that case a metric space is used. A metric space is a set where a notion of distance (called a metric) between elements of the set is defined. In this paper we present an efficient parallelization of a pivot-based method devised for this purpose which is called the Sparse Spatial Selection (SSS) strategy and we compare it with a clustering-based method, a parallel implementation of the Spatial Approximation Tree (SAT). We show that SAT compares favourably against the pivot data structures SSS. The experimental results were obtained on a highperformance cluster and using several metric spaces, that shows load balance parallel strategies for the SAT. The implementations are built upon the BSP parallel computing model, which shows efficient performance for this application domain and allows a precise evaluation of algorithms.VIII Workshop de Procesamiento Distribuido y ParaleloRed de Universidades con Carreras en Informática (RedUNCI

    A DFT-Based Running Time Prediction Algorithm for Web Queries

    Get PDF
    Web search engines are built from components capable of processing large amounts of user queries per second in a distributed way. Among them, the index service computes the topk documents that best match each incoming query by means of a document ranking operation. To achieve high performance, dynamic pruning techniques such as the WAND and BM-WAND algorithms are used to avoid fully processing all of the documents related to a query during the ranking operation. Additionally, the index service distributes the ranking operations among clusters of processors wherein in each processor multi-threading is applied to speed up query solution. In this scenario, a query running time prediction algorithm has practical applications in the efficient assignment of processors and threads to incoming queries. We propose a prediction algorithm for the WAND and BM-WAND algorithms. We experimentally show that our proposal is able to achieve accurate prediction results while significantly reducing execution time and memory consumption as compared against an alternative prediction algorithm. Our proposal applies the discrete Fourier transform (DFT) to represent key features affecting query running time whereas the resulting vectors are used to train a feed-forward neural network with back-propagation.Fil: Rojas, Oscar. Universidad de Santiago de Chile; ChileFil: Gil Costa, Graciela Verónica. Universidad Nacional de San Luis. Facultad de Ciencias Físico- Matemáticas y Naturales; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - San Luis; ArgentinaFil: Marín, Mauricio. Universidad de Chile; Chil

    Suffix Array Performance Analysis for Multi-Core Platforms

    Get PDF
    Performance analysis helps to understand how a particular invocation of an algorithm executes. Using the information provided by specific tools like the profiler tool Perf or the Performance Application Programming Interface (PAPI), the performance analysis process provides a bridging relationship between the algorithm execution and processor events according to the metrics defined by the developer. It is also useful to find performance limitations which depend exclusively on the code. Furthermore, to change an algorithm in order to optimize the code requires more than understanding of the obtained performance. It requires understanding the problem being solved. In this work we evaluate the performance achieved by a suffix array over a 32-core platform. Suffix arrays are efficient data structures for solving complex queries in a number of applications related to text databases, for instance, biological databases. We perform experiments to evaluate hardware features directly aimed to parallelize computation. Moreover, according to the results obtained by the performance evaluation tools, we propose an optimization technique to improve the use of the cache memory. In particular, we aim to reduce the number of cache memory replacement performed each time a new query is processed.Fil: Gil Costa, Graciela Verónica. Universidad Nacional de San Luis. Facultad de Ciencias Físico Matemáticas y Naturales. Laboratorio de Inv.en Inteligencia Artificial; Argentina; Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina;Fil: Ochoa, Cesar. Universidad Nacional de San Luis. Facultad de Ciencias Físico Matemáticas y Naturales. Laboratorio de Inv.en Inteligencia Artificial; Argentina;Fil: Printista, Alicia Marcela. Universidad Nacional de San Luis. Facultad de Ciencias Físico Matemáticas y Naturales. Laboratorio de Inv.en Inteligencia Artificial; Argentina; Consejo Nacional de Investigaciones Científicas y Técnicas; Argentina

    A parallel view for search engines

    Get PDF
    To engineer a search engine is a challenging task. Search engines index tens to hundreds of millions of web pages involving a comparable number of distinct terms. They answer tens of n-tillions of queries every day. Despite the importance of large-scale search engines on the Web, very little academic research has been done on them. Furthermore, due to rapid advance in technology and web proliferation, creating a web search engine today is very different from years ago. In most papers the index simply ”is”, without discussion of how it was created. But for a indexing scheme to be useful it must be possible for the index to be constructed in a reasonable amount of time, and so papers describing complex indexing methods should also describe and analyze a mechanism whereby the index can be built. Scalability is of concern during index construction as well as during query processing. This paper describes the cooperative work between the Crawler, Indexer and the Searcher.VI Workshop de Procesamiento Distribuido y Paralelo (WPDP)Red de Universidades con Carreras en Informática (RedUNCI

    Estrategias paralelas para una máquina de búsqueda línea de investigación: distribución y paralelismo

    Get PDF
    A través de los años con el avance de la tecnología y el crecimiento de Internet, el hombre ha deseado obtener una mayor capacidad de almacenamiento para sus datos y un mayor poder de procesamiento, que permita mejorar los tiempos de respuestas de sus tareas. Debido a ésto, numerosos estudios se han abocado al desarrollo de nuevos modelos que permitan satisfacer dichas demandas, a través de la computación paralela, que ha demostrado ser un paradigma que permite mejorar los tiempos de ejecución de los algoritmos. En trabajos anteriores se han analizado y desarrollado algoritmos paralelos, para estructuras de datos que acceden eficientemente a base de datos textuales distribuidas. Estos algoritmos, denominados Listas Invertidas Locales y Listas Invertidas Globales, fueron diseñados e implementados siguiendo una metodología de diseño y de análisis bien estructurada, a través del modelo de computación BSP [2, 4]. Actualmente se están estudiando diferentes alternativas, denominadas estrategias de buckets, que permiten reducir los costos asociados a los algoritmos de búsqueda en la Web, y también la relación existente entre la máquina de búsqueda y los m´odulos correspondientes al indexador y el crawler.Eje: AlgoritmosRed de Universidades con Carreras en Informática (RedUNCI

    Conversión de RGB a YCbCr en System Generator y HLS

    Get PDF
    Los sistema de recuperación de imágenes basados en contenidos (CBIR) típicamente ejecutan dos tareas de alto costo computacional: (1) generación de la base de datos e indexación y (2) recuperación. Este trabajo se enfoca en la primera tarea la cual es inherentemente paralela, debido a que las imágenes son generalmente divididas en varias partes y cada parte se procesa por separado y de manera similar. Para ello se presenta un conversor de espacio de color de RGB a YCbCr para plataformas de FPGAs basadas en SoCs. Esta conversión de color se utiliza como parte del proceso de extracción del descriptor de la distribución de color, el cual forma parte del estandar MPEG-7 y es utilizado en sistemas CBIR. Se presenta la implementación del conversor haciendo uso de System Generator y de Vivado HLS y se efectúa una comparación de los resultados sobre la plataforma ZYNQ - ZC7020 Evaluation Kit.XV Workshop de Procesamiento Distribuido y Paralelo (WPDP)Red de Universidades con Carreras en Informática (RedUNCI

    Procesamiento de consultas en motores de búsqueda: diseño y evaluación en términos de consumo de energía

    Get PDF
    Actualmente los centros de datos accedidos por los buscadores web junto con las computadoras personales consumen el 10% de la energía mundial, y de ese porcentaje aproximadamente el 2% es consumido sólo por los buscadores y sus centros de datos. Sin embargo, es de esperar que en los próximos años estos porcentajes se incrementen en un 30% o 40% debido a que el tamaño de la Web tiende a duplicarse cada ocho meses, la cantidad de usuarios que se conectan a ésta sigue creciendo y los buscadores satisfacen la creciente demanda incrementando el hardware utilizado. En este trabajo se presentan los objetivos y los desafíos de una línea de investigación que abarca los problemas de consumo de energía que deben solucionar actualmente los grandes centros de cómputos y de datos, en particular los buscadores Web.Eje: Procesamiento distribuido y paraleloRed de Universidades con Carreras en Informática (RedUNCI

    Conversión de RGB a YCbCr en System Generator y HLS

    Get PDF
    Los sistema de recuperación de imágenes basados en contenidos (CBIR) típicamente ejecutan dos tareas de alto costo computacional: (1) generación de la base de datos e indexación y (2) recuperación. Este trabajo se enfoca en la primera tarea la cual es inherentemente paralela, debido a que las imágenes son generalmente divididas en varias partes y cada parte se procesa por separado y de manera similar. Para ello se presenta un conversor de espacio de color de RGB a YCbCr para plataformas de FPGAs basadas en SoCs. Esta conversión de color se utiliza como parte del proceso de extracción del descriptor de la distribución de color, el cual forma parte del estandar MPEG-7 y es utilizado en sistemas CBIR. Se presenta la implementación del conversor haciendo uso de System Generator y de Vivado HLS y se efectúa una comparación de los resultados sobre la plataforma ZYNQ - ZC7020 Evaluation Kit.XV Workshop de Procesamiento Distribuido y Paralelo (WPDP)Red de Universidades con Carreras en Informática (RedUNCI
    corecore