8 research outputs found

    New algorithms for Efficient use of multi-cores and heterogeneous architectures

    No full text
    Depuis la naissance des supercalculateurs jusqu'à l'arrivée de machines Petaflopiques, les technologies qui les entourent n'ont cessé d'évoluer à une vitesse fulgurante. Cette course à la performance se heurte aujourd'hui au passage à l'Exascale, qui se démarque des autres échelles par les difficultés qu'elle impose: Les conséquences qui en découlent bouleversent tous les domaines scientifiques relatifs au Calcul Haute Performance (HPC). Nous nous plaçons dans le contexte des problèmes à valeurs propres, largement répandus: du page ranking aux simulation nucléaires, astronomie, explorations pétrolifères...Notre démarche comporte deux thématiques complémentaires: Nous proposons d'étudier puis d'améliorer la convergence de la méthode Explicitely Restarted Arnoldi Method (ERAM) en réutilisant les informations générées. L'étude de la convergence et sa caractérisation sont indispensable pour pouvoir mettre en place des techniques de Smart-Tuning. La phase d'amélioration consiste à utiliser les valeurs de Ritz de manière efficace afin d'accélérer la convergence de la méthode sans couts supplémentaires en termes de communications parallèles ou de stockage mémoire, paramètres indispensables pour les machines multi-coeurs et hétérogènes. Enfin, nous proposons deux méthodes pour générer des matrices de très larges dimensions aux spectres imposés afin de constituer une collection de matrices de tests qui seront partagées avec la communauté du HPC. Ces matrices serviront à valider numériquement des solveurs de systèmes à valeurs propres d'une part, et d'autre part de pouvoir évaluer leur performances parallèles grâce à leur propriétés adaptées aux machines petaflopiques et au-delà.The supercomputers architectures and programming paradigms have dramatically evolve during the last decades. Since we have reached the Petaflopic scale, we forecast to overcome the Exaflopic scale. Crossing this new scale implies many drastic changes, concerning the overall High Performance Computing scientific fields. In this Thesis, we focus on the eigenvalue problems, implied in most of the industrial simulations. We first propose to study and caracterize the Explicitly Restarted Arnoldi Method convergence. Based on this algorithm, we re-use efficiently the computed Ritz-Eigenvalues to accelerate the ERAM convergence onto the desired eigensubspace. We then propose two matrix generators, starting from a user-imposed spectrum. Such matrix collections are used to numerically check and approve extrem-scale eigensolvers, as well as measure and improve their parallel performance on ultra-scale supercomputers

    Les applications françaises face à l’exascale

    No full text
    La France prépare une réponse au prochain appel à manifestationd’intérêt (AMI) d’EuroHPC1 en vue d’héberger et opérer l’une desmachines européennes exaflopiques prévues en Europe à l’échéance de2024 au sein d’un consortium dont GENCI est la “Hosting Entity” et leTGCC au CEA le “ Hosting Site ”. Ce rapport présente une vision de l'étatactuel des applications des organismes impliqués dans le Projet ExascaleFrance et le dimensionnement des besoins techniques et humainsrelatifs à ces applications qui leur permettront de s’exécuter sur desmachines exaflopiques, afin de rester compétitif dans le paysagemondial du numérique et de mieux dimensionner la réponse française àl’AMI d’EuroHPC. Le SP3 propose quatre recommandations majeures,transverses à toutes les communautés de recherche concernées parl’exascale et un focus particulier sur les ressources humaines nécessairespour les applications recensées

    Les applications françaises face à l’exascale

    No full text
    La France prépare une réponse au prochain appel à manifestationd’intérêt (AMI) d’EuroHPC1 en vue d’héberger et opérer l’une desmachines européennes exaflopiques prévues en Europe à l’échéance de2024 au sein d’un consortium dont GENCI est la “Hosting Entity” et leTGCC au CEA le “ Hosting Site ”. Ce rapport présente une vision de l'étatactuel des applications des organismes impliqués dans le Projet ExascaleFrance et le dimensionnement des besoins techniques et humainsrelatifs à ces applications qui leur permettront de s’exécuter sur desmachines exaflopiques, afin de rester compétitif dans le paysagemondial du numérique et de mieux dimensionner la réponse française àl’AMI d’EuroHPC. Le SP3 propose quatre recommandations majeures,transverses à toutes les communautés de recherche concernées parl’exascale et un focus particulier sur les ressources humaines nécessairespour les applications recensées

    Pushing the Frontier in the Design of Laser-Based Electron Accelerators with Groundbreaking Mesh-Refined Particle-In-Cell Simulations on Exascale-Class Supercomputers

    No full text
    International audienceWe present a first-of-kind mesh-refined (MR) massively parallel Particle-In-Cell (PIC) code for kinetic plasma simulations optimized on the Frontier, Fugaku, Summit, and Perlmutter supercomputers. Major innovations, implemented in the WarpX PIC code, include: (i) a three level parallelization strategy that demonstrated performance portability and scaling on millions of A64FX cores and tens of thousands of AMD and Nvidia GPUs (ii) a groundbreaking mesh refinement capability that provides between 1.5 x to 4 x savings in computing requirements on the science case reported in this paper, (iii) an efficient load balancing strategy between multiple MR levels. The MR PIC code enabled 3D simulations of laser-matter interactions on Frontier, Fugaku, and Summit, which have so far been out of the reach of standard codes. These simulations helped remove a major limitation of compact laser-based electron accelerators, which are promising candidates for next generation high-energy physics experiments and ultra-high dose rate FLASH radiotherapy
    corecore