4 research outputs found

    Predictive and distributed routing balancing (PR-DRB) : high speed interconnection networks

    Get PDF
    Current parallel applications running on clusters require the use of an interconnection network to perform communications among all computing nodes available. Imbalance of communications can produce network congestion, reducing throughput and increasing latency, degrading the overall system performance. On the other hand, parallel applications running on these networks posses representative stages which allow their characterization, as well as repetitive behavior that can be identified on the basis of this characterization. This work presents the Predictive and Distributed Routing Balancing (PR-DRB), a new method developed to gradually control network congestion, based on paths expansion, traffic distribution and effective traffic load, in order to maintain low latency values. PR-DRB monitors messages latencies on intermediate routers, makes decisions about alternative paths and record communication pattern information encountered during congestion situation. Based on the concept of applications repetitiveness, best solution recorded are reapplied when saved communication pattern re-appears. Traffic congestion experiments were conducted in order to evaluate the performance of the method, and improvements were observed.Les aplicacions paral路leles actuals en els Cl煤sters requereixen l'煤s d'una xarxa d'interconnexi贸 per comunicar a tots els nodes de c貌mput disponibles. El desequilibri en la c脿rrega de comunicacions pot congestionar la xarxa, incrementant la lat猫ncia i disminuint el throughput, degradant el rendiment total del sistema. D'altra banda, les aplicacions paral路leles que s'executen sobre aquestes xarxes contenen etapes representatives durant la seva execuci贸 les quals permeten caracteritzar-les, a m茅s d'extraure un comportament repetitiu que pot ser identificat en base a aquesta caracteritzaci贸. Aquest treball presenta el Balanceig Predictiu de Encaminament Distribu茂t (PR-DRB), un nou m猫tode desenvolupat per controlar la congesti贸 a la xarxa en forma gradual, basat en l'expansi贸 de camins, la distribuci贸 de tr脿nsit i c脿rrega efectiva actual per tal de mantenir una lat猫ncia baixa. PR-DRB monitoritza la lat猫ncia dels missatges en els encaminadors, pren decisions sobre els camins alternatius a utilitzar i registra la informaci贸 de la congesti贸 sobre la base del patr贸 de comunicacions detectat, utilitzant com a concepte base la repetitivitat de les aplicacions per despr茅s tornar a aplicar la millor soluci贸 quan aquest patr贸 es repeteixi. Experiments de tr脿nsit amb congesti贸 van ser portats a terme per avaluar el rendiment del m猫tode, els quals van mostrar la bondat del mateix.Las aplicaciones paralelas actuales en los Cl煤steres requieren el uso de una red de interconexi贸n para comunicar a todos los nodos de c贸mputo disponibles. El desbalance en la carga de comunicaciones puede congestionar la red, incrementando la latencia y disminuyendo el throughput, degradando el rendimiento total del sistema. Por otro lado, las aplicaciones paralelas que corren sobre estas redes contienen etapas representativas durante su ejecuci贸n las cuales permiten caracterizarlas, adem谩s de un comportamiento repetitivo que puede ser identificado en base a dicha caracterizaci贸n. Este trabajo presenta el Balanceo Predictivo de Encaminamiento Distribuido (PR-DRB), un nuevo m茅todo desarrollado para controlar la congesti贸n en la red en forma gradual; basado en la expansi贸n de caminos, la distribuci贸n de tr谩fico y carga efectiva actual, a fin de mantener una latencia baja. PR-DRB monitorea la latencia de los mensajes en los encaminadores, toma decisiones sobre los caminos alternativos a utilizar y registra la informaci贸n de la congesti贸n en base al patr贸n de comunicaciones detectado, usando como concepto base la repetitividad de las aplicaciones para luego volver a aplicar la mejor soluci贸n cuando dicho patr贸n se repita. Experimentos de tr谩fico con congesti贸n fueron llevados a cabo para evaluar el rendimiento del m茅todo, los cuales mostraron la bondad del mismo

    Reducing Hot-Spot Contention in Shared Memory Multiprocessor Systems

    No full text
    In parallel systems it is possible for several processors to request concurrent access to a shared data structure such as a synchronization variable. Such an access pattern causes what is known as hotspot contention. In shared-memory multiprocessor systems that use a multistage interconnection network, hot-spot contention may result in "tree saturation" that degrades the system performance. It is important, therefore, to manage hot-spot contention properly. This paper reviews the existing strategies to reduce the effects of hot-spot contention. We first quantify the effects of hot-spot contention and identify the objectives of a hot-spot management strategy. We propose a taxonomy to categorize these strategies into one of avoidance-based, prevention-based, or detection-based methods. We then review and compare several representative strategies that have been proposed to reduce the effects of hot-spot contention. We conclude the paper by identifying several issues that need further res..

    Reducing hot-spot contention in shared-memory multiprocessor systems

    No full text

    Control de congesti贸n adaptativo en redes Infiniband

    Get PDF
    El uso de recursos compartidos en las redes de interconexi贸n de alta performance puede provocar situaciones de congesti贸n de mensajes que degradan notablemente las prestaciones, aumentando la latencia de trasporte y disminuyendo la utilizaci贸n de la red. Hasta el momento las t茅cnicas que intentan solucionar este problema utilizan la regulaci贸n de la inyecci贸n de mensajes. Esta limitaci贸n de la inyecci贸n traslada la contenci贸n de mensajes desde los conmutadores hacia los nodos fuente, incrementando el valor de la latencia promedio global, pudiendo alcanzar valores muy elevados. En este trabajo, proponemos una t茅cnica de control de congesti贸n para redes InfiniBand basada en un mecanismo de encaminamiento adaptativo que distribuye el volumen de comunicaciones entre diversas trayectorias alternativas quitando carga de la zona de congesti贸n, lo que permite eliminarla. La experimentaci贸n realizada muestra la mejora obtenida en latencia y throughput, respecto al mecanismo de control de congesti贸n original de InfiniBand basado en la regulaci贸n de la inyecci贸n. El mecanismo propuesto es totalmente compatible y no requiere que se modifique ning煤n aspecto de la especificaci贸n, debido a que se utilizan componentes de gesti贸n definidos en el est谩ndar InfiniBand
    corecore