4 research outputs found
HICFD – Highly Efficient Implementation of CFD Codes for HPC Many-Core Architectures
The objective of the German BMBF research project Highly Efficient Implementation
of CFD Codes for HPC Many-Core Architectures (HICFD) is to develop
new methods and tools for the analysis and optimization of the performance
of parallel computational fluid dynamics (CFD) codes on high performance computer
systems with many-core processors. In the work packages of the project it
is investigated how the performance of parallel CFD codes written in C can be increased
by the optimal use of all parallelism levels. On the highest level MPI is
utilized. Furthermore, on the level of the many-core architecture, highly scaling,
hybrid OpenMP/MPI methods are implemented. On the level of the processor cores
the parallel SIMD units provided by modern CPUs are exploited
HICFD – Hocheffiziente Implementierung von CFD-Codes für HPC-Many-Core-Architekturen
Bei dem Forschungsprojekt HICFD handelt es sich um ein Verbundprojekt des
vom Bundesministerium für Bildung und Forschung geförderten Programms „IKT 2020 – Forschung
und Innovation“. Das Forschungsprojekt hat zum Ziel, neue Methoden und Werkzeuge zur Analyse
und Optimierung des Leistungsvermögens strömungsmechanischer, paralleler Programme auf Hochleistungsrechnern
mit Prozessoren mit einer Vielzahl von Kernen zu entwickeln und diese exemplarisch
auf die strömungsmechanischen Codes TAU und TRACE des Projektpartners DLR anzuwenden. Die
wesentlichen Ziele des Projektes werden in dieser Arbeit vorgestellt.
Das Leistungsvermögen strömungsmechanischer, paralleler Programme soll in diesem Projekt durch eine
optimale Ausnutzung aller Parallelitätsebenen verbessert werden. Auf der obersten Ebene (MPI) soll
eine intelligente Gitteraufteilung den Lastausgleich zwischen den MPI-Prozessen verbessern. Für blockstrukturierte
Gitter soll hier ein Multi-Core-kompatibles Partitionierungswerkzeug entwickelt werden.
Auf der Ebene der Multi-Core-Architektur sollen exemplarisch für die beiden Strömungslöser TAU und
TRACE hochskalierende hybride OpenMP/MPI-Verfahren implementiert werden. Auf Prozessorkern-
Ebene soll ein Präprozessor entwickelt werden, der die komfortable Nutzung paralleler SIMD-Einheiten
(„Single Instruction Multiple Data“) auch für komplexe Anwendungen ermöglicht. Um zu überprüfen,
in welchem Umfang die Anwendung des Präprozessors das Leistungsvermögen paralleler Programme
beeinflusst, soll die Leistungsanalyse-Software Vampir in Richtung SIMD erweitert werden