Search CORE

7 research outputs found

Dynamic Loop Scheduling Using the MPI Passive-Target Remote Memory Access Model

Author: Ciorba Florina M.
Eleliemy Ahmed
Publication venue: The Platform for Advanced Scientific Computing (PASC) Conference
Publication date: 01/01/2018
Field of study

Large parallel loops are present in many scientific applications. Static and dynamic loop scheduling (DLS) techniques aim to achieve load balanced executions of applications. The use of DLS techniques in scientific applications, such as the self-scheduling-based techniques, showed significant performance advantages compared to static techniques. On distributed-memory systems, DLS techniques have been implemented using the message-passing interface (MPI). Existing implementations of MPI-based DLS libraries do not consider the novel features of the latest MPI standards, such as one-sided communication, shared-memory window creation, and atomic read-modify-write operations. This poster considers these features and proposes an MPI-based DLS library written in the C language. Unlike existing libraries, the proposed DLS library does not employ a master-worker execution model. Moreover, it contains implementations of five well-known DLS techniques, namely self-scheduling, fixed-size chunking, guided self-scheduling, trapezoid self-scheduling, and factoring. An application from the computer vision is used to assess and compare the performance of the proposed library against the performance of existing solutions. The evaluation results show improved performance and highlight the need to revise and upgrade existing solutions in light of the significant advancements in the MPI standards

edoc

Verificación formal del algoritmos de distribución de carga para procesamiento de datos independientes

Author: JOSE LUIS QUIROZ FABIAN
Publication venue
Publication date: 21/04/2007
Field of study

Para verificar DLML se valida el cumplimiento de las propiedades propuestas y de dos nuevas propie-dades relacionadas a la implementación. Después de verificar el modelo de la versión original de DLML se proponen nuevas implementaciones de este distribuidor, donde se contemplan aspectos como la capacidad de los canales, la no dependencia en la granularidad de los datos y la disminución de la cantidad de mensajes (y con ello mejorar su rendimiento). La versión que muestra mejor rendimiento, nombrada DLML-híbrido, es verificada utilizando las mis-mas propiedades que se verificaron sobre la versión original de DLML. Además se realiza su implementación en lenguaje C-MPI en la que se incorpora el uso de memoria compartida e hilos de ejecución, aprovechan-do el surgimiento de las nuevas arquitectura multicore/multiprocesador ( donde se tiene más de un núcleo (procesador) por nodo). El trabajo de la presente tesis concluye mostrando una comparación de rendimiento de la versión DLML-híbrido con la versión original de DLML, para la cual se utilizaron aplicaciones que manejan datos de gra-nularidad diferente (fina y gruesa). En la comparación se efectúa al utilizar un cluster de 32 nodos de tipo multiprocesador (4 procesadores por nodo, teniendo un total de 128 procesadores). Para la aplicación de gra-nularidad fina DLML-híbrido presenta mejores tiempos de ejecución mientras más procesadores se utilizan. La versión DLML original para este caso obtiene mejores tiempos de ejecución con un número menor de procesadores y pierde eficiencia cuando el número de nodos aumenta. Para la aplicación de granularidad gruesa la versión DLML-híbrido siempre obtiene mejores tiempos de ejecución que la versión original.Los algoritmos de distribución de datos (carga) de procesamiento independiente proveen un conjunto de beneficios a las aplicaciones paralelas tales como: la minimización de su tiempo de ejecución, la maximi-zación de uso de los recursos, etc. Pero por su naturaleza paralela, la implementación de un algoritmo de distribución de datos es compleja lo que puede originar que no cumpla con las especificaciones para las que fue diseñado presentando problemas como: violación a la exclusión mutua, no terminación de la ejecución paralela, abrazos mortales, etc. En esta tesis de maestría, como primer etapa, se propone, modela y verifica formalmente una estructura básica que integra un algoritmo de distribución cíclico en una aplicación SPMD (Simple Program Multiple Data) de procesamiento de datos independientes. Para este proceso de verificación, auxiliándonos de la lógica temporal, se propone un conjunto de propiedades que reflejan un buen funcionamiento del sistema independientemente del algoritmo de distribución usado. La herramienta de verificación utilizada fue Spin, la cual aplica la técnica de verificación de model checking (un método que permite verificar algoritmos paralelos con un espacio de estados finito) y nos permite obtener un diagnóstico del cumplimiento de las propiedades. El sistema se modeló mediante el lenguaje promela utilizado por Spin, realizando la verificación de todas las propiedades especificadas. En la segunda etapa de este proyecto se propone un modelo promela para la verificación de la herramienta DLML (Data List Management Library) basándonos en la estructura propuesta en la primera etapa. DLML es una librería creada en el Laboratorio de Sistemas Distribuidos y Paralelos de la UAM-1 para distribuir la carga (datos) generada por las aplicaciones, de manera transparente para el programador

BINDANI