3 research outputs found

    Broadcasting in Prefix Space: P2P Data Dissemination with Predictable Performance

    Full text link
    A broadcast mode may augment peer-to-peer overlay networks with an efficient, scalable data replication function, but may also give rise to a virtual link layer in VPN-type solutions. We introduce a simple broadcasting mechanism that operates in the prefix space of distributed hash tables without signaling. This paper concentrates on the performance analysis of the prefix flooding scheme. Starting from simple models of recursive kk-ary trees, we analytically derive distributions of hop counts and the replication load. Extensive simulation results are presented further on, based on an implementation within the OverSim framework. Comparisons are drawn to Scribe, taken as a general reference model for group communication according to the shared, rendezvous-point-centered distribution paradigm. The prefix flooding scheme thereby confirmed its widely predictable performance and consistently outperformed Scribe in all metrics. Reverse path selection in overlays is identified as a major cause of performance degradation.Comment: final version for ICIW'0

    Considering Complex Search Techniques in DHTs Under Churn

    Get PDF
    Abstract-Traditionally complex queries have been performed over unstructured P2P networks by means of flooding, which is inherently inefficient due to the large number of redundant messages generated. While Distributed Hash Tables (DHTs) can provide very efficient look-up operations, they traditionally do not provide any methods for complex queries. By exploiting the structure inherent in DHTs we can perform complex querying over structured P2P networks by means of efficiently broadcasting the search query. This allows every node in the network to process the query locally, and hence is as powerful and flexible as flooding in unstructured networks, but without the inefficiency of redundant messages. While there have been various approaches proposed for broadcasting search queries over DHTs, the focus has not been on validation under churn. Comparing blind search methods for DHTs through simulation we see that churn, in particular nodes leaving the network, has a large impact on query success rate. In this paper we present novel results comparing blind search over Chord and Pastry while under varying levels of churn. We further consider how different data replication strategies can be used to enhance the query success rate

    Distributed Late-binding Micro-scheduling and Data Caching for Data-Intensive Workflows

    Get PDF
    Tesis in茅dita de la Universidad Complutense de Madrid, Facultad de Inform谩tica, Departamento de Arquitectura de Computadores y Autom谩tica, le铆da el 06-07-2015El mundo de hoy en d铆a se encuentra inundado por ingentes cantidades de informaci贸n digital procedente de muy diversas fuentes. Todo apunta, adem谩s, a que esta tendencia se agudizar谩 en el futuro. Ni la industria, ni la sociedad en general, ni, muy particularmente, la ciencia, permanecen indiferentes ante este hecho. Al contrario, se esfuerzan por obtener el m谩ximo provecho de esta informaci贸n, lo que significa que deben capturarla, transferirla, almacenarla y procesarla puntual y eficientemente, utilizando una amplia gama de recursos computacionales. Pero esta tarea no es siempre sencilla. Un ejemplo representativo de los desaf铆os que suponen el manejo y procesamiento de grandes cantidades de datos es el de los experimentos de f铆sica de part铆culas del Large Hadron Collider (LHC), en Ginebra, que cada a帽o deben gestionar decenas de petabytes de informaci贸n. Bas谩ndonos en la experiencia de una de estas colaboraciones, hemos estudiado los principales problemas relativos a la gesti贸n de vol煤menes de datos masivos y a la ejecuci贸n de vastos flujos de trabajo que necesitan consumirlos. En este contexto, hemos desarrollado una arquitectura de prop贸sito general para la planificaci贸n y ejecuci贸n de flujos de trabajo con importantes requisitos de datos, que hemos llamado Task Queue. Este nuevo sistema aprovecha el modelo de asignaci贸n tard铆a basado en agentes que ha ayudado a los experimentos del LHC a superar los problemas asociados con la heterogeneidad y la complejidad de las grandes infraestructuras grid de computaci贸n. Nuestra propuesta presenta varias mejoras con respecto a los sistemas existentes. Los agentes de ejecuci贸n de la arquitectura Task Queue comparten una tabla hash distribuida (Distributed Hash Table, DHT) y realizan la asignaci贸n de tareas de una manera cooperativa. De esta forma, se evitan los problemas de escalabilidad de los algoritmos centralizados de asignaci贸n y se mejoran los tiempos de ejecuci贸n. Esta escalabilidad nos permite realizar una microplanificaci贸n de grano fino lo cual posibilita nuevas funcionalidades, como la implementaci贸n de una cache distribuida en los nodos de ejecuci贸n y el uso de la informaci贸n de ubicaci贸n de los datos en las decisiones de asignaci贸n de tareas. Esto mejora la eficiencia del procesado de datos y ayuda a aliviar los habitualmente congestionados servicios de almacenamiento del grid. Adem谩s, nuestro sistema es m谩s robusto frente a problemas en la interacci贸n con la cola central de tareas y ofrece mejor comportamiento en situaciones con patrones de acceso a datos exigentes o en ausencia de servicios de almacenamiento locales. Todo esto ha sido demostrado en una amplia serie de pruebas de evaluaci贸n. Dado que nuestro procedimiento de planificaci贸n de tareas distribuido requiere el uso de mensajes de broadcast, tambi茅n hemos realizado un profundo estudio de las posibles aproximaciones a la implementaci贸n de esta operaci贸n sobre el DHT Kademlia, el cual es utilizado para la cache de datos compartida. Kademlia ofrece enrutamiento a nodos individuales pero no incluye ninguna primitiva de broadcast. Nuestro trabajo expone las peculiaridades de este sistema, particularmente su m茅trica basada en la operaci贸n XOR, y estudia anal铆ticamente qu茅 t茅cnicas de broadcast pueden ser usadas con 茅l. Tambi茅n se ha desarrollado un modelo que estima la cobertura de nodos en funci贸n de la probabilidad que cada mensaje individual alcance su destino correctamente. Como validaci贸n, los algoritmos se han implementado y se han evaluado exhaustivamente. Adem谩s, proponemos varias t茅cnicas para mejorar los protocolos en situaciones adversas, por ejemplo cuando el sistema presenta una alta rotaci贸n de nodos o la tasa de error en las entregas no es despreciable. Esta t茅cnicas incluyen redundancia, reenv铆o e inundaci贸n (flooding), as铆 como combinaciones de las mismas. Presentamos un an谩lisis de las fortalezas y debilidades de los diferentes algoritmos y las mencionadas t茅cnicas complementarias.Depto. de Arquitectura de Computadores y Autom谩ticaFac. de Inform谩ticaTRUEunpu
    corecore