3 research outputs found

    Parametric micro-level performance models for parallel computing and parallel implementation of hydrostatic MM5

    Get PDF
    This dissertation presents Parametric micro-level performance models and Parallel implementation of the hydrostatic version of MM5;Parametric micro-level (PM) performance models are introduced to address the important issue of how to realistically model parallel performance. These models can be used to predict execution times and identify performance bottlenecks. The accurate prediction and analysis of execution times is achieved by incorporating precise details of interprocessor communication, memory operations, auxiliary instructions, and effects of communication and computation schedules. The parameters provide the flexibility to study various algorithmic and architectural issues. The development and verification process, parameters and the scope of applicability of these models are discussed. A coherent view of performance is obtained from the execution profiles generated by PM models. The models are targeted at a large class numerical algorithms commonly implemented on both SIMD and MIMD machines. Specific models are presented for matrix multiplication, LU decomposition, and FFT on a 2-D processor array with distributed memory. A case study includes comparison of parallel machines and parallel algorithms. In a comparison of parallel machines, PM models are used to analyze execution times so as to relate the performance to architectural attributes of a machine. In a comparison of parallel algorithms, PM models are used to study performance of two LU decomposition algorithms: non-blocked and blocked. Two algorithms are compared to identify the tradeoffs between them. This analysis is useful to determine an optimum block size for the blocked algorithm. The case study is done on MasPar MP-1 and MP-2 machines;The dissertation also describes the parallel implementation of the hydrostatic version of MM5 (the fifth generation of Mesoscale Model), which has been widely used for climate studies. The model was parallelized in machine-independent manner using the Runtime System Library (RSL), a runtime library for handling message-passing and index transformation. The dissertation discusses validation of the parallel implementation of MM5 using field data and presents performance results. The parallel model was tested on the IBM SP1, a distributed memory parallel computer

    Resolução numerica de um problema de fronteira livre : cavitação na lubrificação hidrodinamica de mancais

    Get PDF
    Orientador: Carlos A. de Moura e Jose Vitorio ZagoTese (doutorado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação CientíficaResumo: O objetivo desta pesquisa é construir algoritmos seqüenciais e paralelos, adequados para a simulação numérica de problemas de fronteira livre que são modelados por inequações variacionais, o que fazemos focalizando o problema da cavitação na lubrificação hidrodinâmica de mancais. Este problema é modelado para a pressão do fluido lubrificante pela equação de Reynolds sob hipóteses simplificadoras apropriadas, com condições de fronteira essenciais nulas e em um domínio periódico. Faz parte do problema determinar onde esta equação é satisfeita e, para tanto devem ser impostas condições complementares na interface desta região. A formulação variacional do problema é atrativa porque além de transformar as condições complementares em naturais, garante resultados teóricos de existência e unicidade da solução, e fornece tal região automaticamente. O trabalho descreve argumentos para a seleção de algoritmos, desde o ponto de vista da descrição física do problema, até o da seleção do computador usado. O algoritmo construído é composto basicamente por dois processos iterativos: um externo associado ao método da penalização, necessário para transformar a inequação em equação variacional, e um interno associado ao método dos gradientes conjugados com precondicionador para resolver o sistema gerado pelo método dos elementos finitos. Este último é que foi implementado segundo a estratégia elemento por elemento que é facilmente paralelizada. A versão seqüencial do programa computacional deste algoritmo foi usada para analisar a influência dos parâmetros físicos do problema, como a rotação, a razão de excentricidade e a razão comprimento por diâmetro. Os testes foram realizados em um microcomputador. . A performance da versão paralela do mesmo programa foi testada através do seu uso exclusivo em uma rede heterogênea de cinco processadores com o pacote P.V.M. instalado, disponível no CENAPAD/SP.Abstract: This research seeks to build sequential and parallel algorithms for the numerical simulation of free boundary problems that are modelled by variational inequalities. That was done with the focus on the cavitational problem for journal bearings. This problems is modelled for the pression of the lubricating fluid under the Reynolds equation with simplified hypothesis, with null essential boundary conditions and over a periodic domain. It is part of the problem to find where this equation is satisfied and in order to do this, another condition should be imposed on the interface of this region. The variational formulation of the problem is attractive because besides transforming this essential condition on natural condition, it assures existency and unicity of the solution and gives that region automatically. The work describes arguments for the selection of the algorithm, beginning by the physical descrition of the problem and goes as far as the selection of the computer used. The chosen algorithm is basically composed by two iteratives parts: the first associated to pena1ty method, necessary to transform the inequality into equality variational, and the second associated to the conjugated gradient method to solve the linear system generated by the use of the finite element method. This second part was implemented' by element-by-element strategy which is easily parallelized. The sequential version of the program was implemented for a microcomputer in order to analyse the influence of the physical parameters like the rotation, the ratio of excentricity and the ratio length by widht. The parallel version performance was tested by exclusive use in heterogeneous network of five processors with the P.V.M. at CENAPAD/SP.DoutoradoDoutor em Matemática Aplicad

    Procesamiento paralelo : Balance de carga dinámico en algoritmo de sorting

    Get PDF
    Algunas técnicas de sorting intentan balancear la carga mediante un muestreo inicial de los datos a ordenar y una distribución de los mismos de acuerdo a pivots. Otras redistribuyen listas parcialmente ordenadas de modo que cada procesador almacene un número aproximadamente igual de claves, y todos tomen parte del proceso de merge durante la ejecución. Esta Tesis presenta un nuevo método que balancea dinámicamente la carga basado en un enfoque diferente, buscando realizar una distribución del trabajo utilizando un estimador que permita predecir la carga de trabajo pendiente. El método propuesto es una variante de Sorting by Merging Paralelo, esto es, una técnica basada en comparación. Las ordenaciones en los bloques se realizan mediante el método de Burbuja o Bubble Sort con centinela. En este caso, el trabajo a realizar -en términos de comparaciones e intercambios- se encuentra afectada por el grado de desorden de los datos. Se estudió la evolución de la cantidad de trabajo en cada iteración del algoritmo para diferentes tipos de secuencias de entrada, n datos con valores de a n sin repetición, datos al azar con distribución normal, observándose que el trabajo disminuye en cada iteración. Esto se utilizó para obtener una estimación del trabajo restante esperado a partir de una iteración determinada, y basarse en el mismo para corregir la distribución de la carga. Con esta idea, el métoEs revisado por: http://sedici.unlp.edu.ar/handle/10915/9500Facultad de Ciencias Exacta
    corecore