29 research outputs found

    Programming the Linpack Benchmark for the IBM PowerXCell 8i Processor

    Get PDF

    Linpack evaluation on a supercomputer with heterogeneous accelerators

    Full text link
    Abstract—We report Linpack benchmark results on the TSUBAME supercomputer, a large scale heterogeneous system equipped with NVIDIA Tesla GPUs and ClearSpeed SIMD accelerators. With all of 10,480 Opteron cores, 640 Xeon cores, 648 ClearSpeed accelerators and 624 NVIDIA Tesla GPUs, we have achieved 87.01TFlops, which is the third record as a heterogeneous system in the world. This paper describes careful tuning and load balancing method required to achieve this performance. On the other hand, since the peak speed is 163 TFlops, the efficiency is 53%, which is lower than other systems. This paper also analyses this gap from the aspect of system architecture. I

    Multilayered Heterogeneous Parallelism Applied to Atmospheric Constituent Transport Simulation

    Get PDF
    Heterogeneous multicore chipsets with many levels of parallelism are becoming increasingly common in high-performance computing systems. Effective use of parallelism in these new chipsets constitutes the challenge facing a new generation of large scale scientific computing applications. This study examines methods for improving the performance of two-dimensional and three-dimensional atmospheric constituent transport simulation on the Cell Broadband Engine Architecture (CBEA). A function offloading approach is used in a 2D transport module, and a vector stream processing approach is used in a 3D transport module. Two methods for transferring incontiguous data between main memory and accelerator local storage are compared. By leveraging the heterogeneous parallelism of the CBEA, the 3D transport module achieves performance comparable to two nodes of an IBM BlueGene/P, or eight Intel Xeon cores, on a single PowerXCell 8i chip. Module performance on two CBEA systems, an IBM BlueGene/P, and an eight-core shared-memory Intel Xeon workstation are given

    High Performance Computing with the Cell Broadband Engine

    Get PDF

    The QPACE Supercomputer : Applications of Random Matrix Theory in Two-Colour Quantum Chromodynamics

    Get PDF
    QPACE is a massively parallel and scalable supercomputer designed to meet the requirements of applications in Lattice Quantum Chromodynamics. The project was carried out by several academic institutions in collaboration with IBM Germany and other industrial partners. In November 2009 and June 2010 QPACE was the leading architecture on the Green 500 list of the most energy efficient supercomputers in the world

    Incidencia de los modelos de programación paralela y escalado de frecuencia de CPUs en el consumo energético de los sistemas de HPC

    Get PDF
    El consumo energético se ha vuelto uno de los mayores desafíos en el campo de la computación de altas prestaciones (HPC). El costo energético producido por las supercomputadoras, durante el tiempo de vida de la instalaci ón, es similar al de adquisición. Así, además de su incidencia en el medio ambiente, la energía es un factor limitante para el HPC. Nuestra línea de investigación se orienta a intentar reducir el consumo energ ético de los sistemas de cómputo paralelo, a través de modi caciones en los algoritmos de las aplicaciones. En este artículo, analizamos el consumo energé- tico de las aplicaciones paralelas, buscando la posible in uencia (en el consumo) de los paradigmas de programación paralela de memoria compartida (OpenMP) y paso de mensajes (MPI), y sus variaciones a diferentes niveles de escalado de frecuencia de las CPUs. Los resultados muestran que el modelo de programación tiene una incidencia importante en el consumo energético de los sistemas de cómputo, y que, reducir la frecuencia de las CPUs no siempre lleva a una reducción en el consumo y hasta puede aumentarlo. Creemos que este estudio puede ser un punto de partida importante para futuros trabajos en el área.Presentado en el X Workshop Procesamiento Distribuido y Paralelo (WPDP)Red de Universidades con Carreras en Informática (RedUNCI

    Incidencia de los modelos de programación paralela y escalado de frecuencia de CPUs en el consumo energético de los sistemas de HPC

    Get PDF
    El consumo energético se ha vuelto uno de los mayores desafíos en el campo de la computación de altas prestaciones (HPC). El costo energético producido por las supercomputadoras, durante el tiempo de vida de la instalaci ón, es similar al de adquisición. Así, además de su incidencia en el medio ambiente, la energía es un factor limitante para el HPC. Nuestra línea de investigación se orienta a intentar reducir el consumo energ ético de los sistemas de cómputo paralelo, a través de modi caciones en los algoritmos de las aplicaciones. En este artículo, analizamos el consumo energé- tico de las aplicaciones paralelas, buscando la posible in uencia (en el consumo) de los paradigmas de programación paralela de memoria compartida (OpenMP) y paso de mensajes (MPI), y sus variaciones a diferentes niveles de escalado de frecuencia de las CPUs. Los resultados muestran que el modelo de programación tiene una incidencia importante en el consumo energético de los sistemas de cómputo, y que, reducir la frecuencia de las CPUs no siempre lleva a una reducción en el consumo y hasta puede aumentarlo. Creemos que este estudio puede ser un punto de partida importante para futuros trabajos en el área.Presentado en el X Workshop Procesamiento Distribuido y Paralelo (WPDP)Red de Universidades con Carreras en Informática (RedUNCI

    System design approach to energy-efficient data centers

    Get PDF
    Thesis (S.M. in Engineering and Management)--Massachusetts Institute of Technology, Engineering Systems Division, System Design and Management Program, 2011.Cataloged from PDF version of thesis.Includes bibliographical references (p. 63-65).Green HPC is the new standard for High Performance Computing (HPC). This has now become the primary interest among HPC researchers because of a renewed emphasis on Total Cost of Ownership (TCO) and the pursuit of higher performance. Quite simply, the cost of operating modern HPC equipment can rapidly outstrip the cost of acquisition. This phenomenon is recent and can be traced to the inadequacies in modern CPU and Datacenter systems design. This thesis analyzes the problem in its entirety and describe best practice fixes to solve the problems of energy-inefficient HPC.by Kurt Keville.S.M.in Engineering and Managemen
    corecore