32 research outputs found

    An empirical investigation of simplified step-size adapatation in evolution strategies with a view to theory

    Get PDF
    Randomized direct-search methods for the optimization of a function f: R^n -> R given by a black box for f-evaluations are investigated. We consider the cumulative step-size adaptation (CSA) for the variance of multivariate zero-mean normal distributions. Those are commonly used to sample new candidate solutions within metaheuristics, in particular within the CMA Evolution Strategy (CMA-ES), a state-of-the-art direct-search method. Though the CMA-ES is very successful in practical optimization, its theoretical foundations are very limited because of the complex stochastic process it induces. To forward the theory on this successful method, we propose two simplifications of the CSA used within CMA-ES for step-size control. We show by experimental and statistical evaluation that they perform sufficiently similarly to the original CSA (in the considered scenario), so that a further theoretical analysis is in fact reasonable. Furthermore, we outline in detail a probabilistic/theoretical runtime analysis for one of the two CSA-derivatives

    A Runtime-Based Dynamic Mesh-Partitioning Approach

    Get PDF
    Large-scale parallel numerical simulations are fundamental for the understanding of a wide variety of aeronautical problems. Mesh decomposition is applied to make use of parallel hardware. In particular, when using a massively parallel architecture, not only the final quality of the mesh subdivision is relevant. Also the partitioning algorithm itself needs to be robust as well as efficient. A strategy for dynamic mesh partitioning based on runtime measurements is presented. We integrate the "Geometric Mesh Partitioner" (GeMPa), which is a partitioning library based on Hilbert Space-Filling Curve (HSFC), in the FlowSimulator (FS) software. FS is a platform designed to run multi-disciplinary simulations on massively parallel cluster architectures. The algorithm performance is evaluated on an unstructured mesh representing the ONERA M6 wing. In particular, the load imbalance among processes is evaluated and compared with a well-known graph-based partitioning approach. Finally, we analyze how the number of processes influences the load imbalance

    Performance Analysis of Complex Engineering Frameworks

    Get PDF
    Many engineering applications require complex frameworks to simulate the intricate and extensive sub-problems involved. However, performance analysis tools can struggle when the complexity of the application frameworks increases. In this paper, we share our efforts and experiences in analyzing the performance of CODA, a CFD solver for aircraft aerodynamics developed by DLR, ONERA, and Airbus, which is part of a larger framework for multi-disciplinary analysis in aircraft design. CODA is one of the key next-generation engineering applications represented in the European Centre of Excellence for Engineering Applications (EXCELLERAT). The solver features innovative algorithms and advanced software technology concepts dedicated to HPC. It is implemented in Python and C++ and uses multi-level parallelization via MPI or GASPI and OpenMP. We present, from an engineering perspective, the state of the art in performance analysis tools, discuss the demands and challenges, and present first results of the performance analysis of a CODA performance test case

    HICFD – Highly Efficient Implementation of CFD Codes for HPC Many-Core Architectures

    Get PDF
    The objective of the German BMBF research project Highly Efficient Implementation of CFD Codes for HPC Many-Core Architectures (HICFD) is to develop new methods and tools for the analysis and optimization of the performance of parallel computational fluid dynamics (CFD) codes on high performance computer systems with many-core processors. In the work packages of the project it is investigated how the performance of parallel CFD codes written in C can be increased by the optimal use of all parallelism levels. On the highest level MPI is utilized. Furthermore, on the level of the many-core architecture, highly scaling, hybrid OpenMP/MPI methods are implemented. On the level of the processor cores the parallel SIMD units provided by modern CPUs are exploited

    DLR's TAU Code on Massively Parallel Architectures - Hybrid MPI/Shared-Memory Parallelization

    No full text
    Outline - Intro to DLR's TAU code for CFD - The HICFD project, short intro - SIMD - single instruction multiple data - DLR’s TAU code on many cores - Hybrid parallelization: shared memory (threads) + MPI - Domain decomposition (for MPI) - Multiple threads for a single (MPI) domain - Summary and Outloo

    Schlussbericht zum DLR-Beitrag "Skalierbare Numerikverfahren für Aerodynamiksimulationen" ("SIENA") im LuFo-V-3-Verbund "Hochskalierbare parallele Methoden für die numerische Simulation in der Luftfahrttechnologie für eine massive Digitalisierung in der Fluggeräte- und Triebwerksentwicklung" ("Towards highly scalable algorithms for numerical simulations in aeronautics": "TOSCANA"), Laufzeit: 1/2018-12/2021

    No full text
    Das Vorhaben "Skalierbare Numerikverfahren für Aerodynamiksimulationen" ("SIENA") des DLR im Rahmen des dritten Aufrufs des fünften zivilen Luftfahrtforschungsprogramms (LuFo V-3) bildet zusammen mit Vorhaben sechs weiterer Partner den LuFo-V-3-Verbund "Hochskalierende parallele Methoden für die numerische Simulation in der Luftfahrt" ("TOwards highly SCalable Algorithms for Numerical simulations in Aeronautics", kurz: "TOSCANA"). Das Vorhaben SIENA zielt ab auf eine verbesserte und insbesondere zukunftssichere Nutzung von Hochleistungsrechnen (HPC) für numerische Simulationen in der Flugzeugaerodynamik und der Antriebstechnik. Dazu werden aktuelle Entwicklungen im Bereich des Hochleistungsrechnens in Parallelisierungskonzepte umgesetzt und konkret in den in SIENA weiterentwickelten numerischen Werkzeugen realisiert. Damit ist die Skalierbarkeit von CFD-Rechnungen um den Faktor 10 verbessert gegenüber 2016. Auch die Beschleunigung einzelner CFD-Simulationen um den Faktor 10 (auf aktueller Hardware im Vergleich zu einer Simulation mit einem Referenz-Löser) wurde demonstriert. Die wichtigsten Ergebnisse, die in SIENA realisiert wurden, sind: - Überarbeitung des HPC-Layer im CFD-Löser Flucs (heute Teil von CODA) zur effizienten und zukunftssicheren Nutzung von HPC-Technologie mit dem Fokus auf einer Hardware-adäquaten Multi-Level-Parallelisierung. - Überarbeitung des HPC-Layer in der Spliss-Löser-Bibliothek für dünnbesetzte lineare Gleichungssysteme mit dem Ziel einer effizienten und zukunftssicheren Nutzung von HPC-Technologie. Der Fokus liegt auf einer Parallelisierung, die neben der Nutzung von geteiltem Speicher die Nutzung von SIMD (Single Instruction / Multiple Data) sowie von 1-seitiger Netzwerk-Kommunikation effektiv unterstützt. - Erweiterung der multidisziplinären Simulationsumgebung FlowSimulator, nämlich des Plug-Ins zur Netzdeformation vermöge Elastizitätsanalogie, hinsichtlich der Nutzung geteilten Speichers als zweite Parallelisierungsebene, um eine möglichst durchgängige 2-Level-Parallelisierung im FlowSimulator von CFD/CSM-Simulationen mit CODA als CFD-Löser zu ermöglichen. Neben diesen HPC-ausgerichteten Verbesserungen vorhandener Funktionalitäten haben die Arbeiten in SIENA ferner die folgenden funktionalen Erweiterungen realisiert: - Erweiterung des Diskontinuierlichen Galerkin-Verfahrens (DG-Verfahren) höherer Ordnung in CODA um die Fähigkeit der lokalen hp-Adaption - Erweiterung der Netzdeformation auf Basis der Elastizitätsgleichungen für Netze mit Zellen höherer Ordnung - Erweiterung der Spliss-Löser-Bibliothek hinsichtlich der Unterstützung für Multi-Block-Vektoren-Problemstellungen wie sie sich bspw. aus dem Harmonic-Balance-Verfahren ergeben sowie hinsichtlich Matrix-freier Algorithmen für dünnbesetzte lineare Probleme wie sie bei der Diskretisierung auf strukturierten Netzen entstehen

    Über die hoch-parallele Implementierung der CFD-Software von ONERA, DLR und Airbus (CODA)

    No full text
    Die numerische Strömungssimulation (Computational Fluid Dynamics, CFD) ist eine entscheidende Schlüsseltechnologie für die vollständige digitale Beschreibung und den Entwurf von Luftfahrzeugen im Rahmen eines multi-disziplinärer Simulationsprozesses. Sie ist daher ein wesentliches Element auf dem Weg zum virtuellen Produkt, welches das "Leitkonzept 6" der DLR-Luftfahrtforschung bildet. Da hochgenaue CFD-Verfahren zu besonders hohen Rechenaufwänden führen, ist die effiziente Nutzung aktueller und künftiger Hoch- und Höchstleistungsrechensystemen von kritischer Bedeutung. Das DLR entwickelt zu diesem Zweck im Rahmen einer europäischen Kooperation zwischen Forschungseinrichtungen und Industriepartnern eine neue CFD-Software von ONERA, DLR und Airbus (CODA). Die allgemeine Verfügbarkeit von Exascale-Höchstleitungsrechensystemen auch für Engineering-Anwendungen ist inzwischen absehbar. Solch enorme nominellen Simulationskapazitäten aus Hardware-Sicht erfordern jedoch Software, die diese massiv parallele Hardware auch tatsächlich effizient nutzen kann. Für auf Gebietszerlegung (domain decomposition) basierende Algorithmen, die im Allgemeinen für die numerische Strömungssimulation verwendet werden, hat sich gezeigt, dass die Ausführung eines MPI-Prozesses, d. h. eines Teilgebiets (einer domain) pro CPU-Kern nicht mehr ausreichend gut parallel skaliert, als dass massiv parallel Architekturen mit Hunderten von CPU-Kernen pro Cluster-Knoten effizient genutzt werden könnten -- es gibt bei dieser einfachen Parallelisierungsstrategie schlicht zu viele Prozesse pro Knoten, die mit anderen entfernten Prozessen kommunizieren müssen. CODA realisiert daher eine 2-stufige Parallelisierung, bei der die Bearbeitung einer Domain innerhalb eines MPI-Prozesses durch mehrere CPU-Kerne erfolgen kann. Dieses zusätzliche Parallelisierungsebene ermöglicht CODA eine hoch-parallele Ausführung, welche den effizienten Einsatz auch sehr großer Rechenressourcen erlaubt, was zur Reduktion von Durchlaufzeiten eingesetzt werden kann. In diesem Vortrag werden das CODA-Parallelisierungskonzept sowie einzelne damit demonstrierte Skalierungsergebnisse vorgestellt
    corecore