39 research outputs found

    Energy-Aware Solution of Linear Systems with Many Right Hand Sides

    No full text

    Factorized Solution of Generalized Stable Sylvester Equations Using Many-Core GPU Accelerators

    Get PDF

    N煤cleos de 谩lgebra energ茅ticamente eficientes en FPGA para computaci贸n de altas prestaciones

    Get PDF
    The dissemination of multi-core architectures and the later irruption of massively parallel devices, led to a revolution in High-Performance Computing (HPC) platforms in the last decades. As a result, Field- Programmable Gate Arrays (FPGAs) are re-emerging as a versatile and more energy-efficient alternative to other platforms. Traditional FPGA design implies using low-level Hardware Description Languages (HDL) such as VHDL or Verilog, which follow an entirely different programming model than standard software languages, and their use requires specialized knowledge of the underlying hardware. In the last years, manufacturers started to make big efforts to provide High-Level Synthesis (HLS) tools, in order to allow a grater adoption of FPGAs in the HPC coimnunity. Our work studies the use of multi-core hardware and different FPGAs to address Numerical Linear Algebra (NLA) kernels such as the general matrix multiplication (GEMM) and the sparse matrix-vector multiplication (SpMV). Specifically, we compare the behavior of fine-tuned kernels in a multi-core CPU processor and HLS implementations on FPGAs. We perform the experimental evaluation of our implementations on a low-end and a cutting-edge FPGA platform, in terms of runtime and energy consumption, and compare the results against the Intel MKL library in CPU.La masificaci贸n de arquitecturas de multin煤cleo y la posterior irrupci贸n de dispositivos masivamente paralelos produjeron una revoluci贸n en las plataformas de computaci贸n de altas prestaciones. Como resultado, las FPGAs (del ingl茅s, Field-Programmable Gate Arrays) est谩n resurgiendo como una alternativa vers谩til y m谩s eficiente desde el punto de vista energ茅tico. El flujo de dise帽o tradicional en FPGAs implica el uso de lenguajes de descripci贸n de hardware de bajo nivel, como VHDL o Verilog, que siguen un modelo de programaci贸n completamente diferente al de los lenguajes de software est谩ndar, y su uso requiere un conocimiento especializado del hardware subyacente. En los 煤ltimos a帽os, los fabricantes comenzaron a hacer grandes esfuerzos para proporcionar herramientas de s铆ntesis de alto nivel, con el fin de permitir una mayor adopci贸n de las FPGAs en la comunidad de computaci贸n de altas prestaciones. Nuestro trabajo estudia el uso de plataformas multin煤cleo y diferentes FPGAs para abordar problemas de 谩lgebra lineal num茅rica (NLA) como la multiplicaci贸n de matrices (GEMM) y la multiplicaci贸n de matriz dispersa por vector (SpMV). Espec铆ficamente, comparamos el comportamiento de implementaci贸nes optimizadas para un procesador multin煤cleo y las im- plementaciones con s铆ntesis de alto nivel en FPGAs. Realizamos la evaluaci贸n experimental de nuestras im- plementaciones en una plataforma FPGA de gama baja y otra de gama alta, analizando tiempo de ejecuci贸n y consumo de energ铆a, y comparamos los resultados con la biblioteca Intel MKL para CPU.Facultad de Inform谩tic

    High Performance Matrix Inversion of SPD Matrices on Graphics Processors

    No full text
    corecore