12 research outputs found

    Master of Science

    Get PDF
    thesisTo address the need of understanding and optimizing the performance of complex applications and achieving sustained application performance across different architectures, we need performance models and tools that could quantify the theoretical performance and the resultant gap between theoretical and observed performance. This thesis proposes a benchmark-driven Roofline Model Toolkit to provide theoretical and achievable performance, and their resultant gap for multicore, manycore, and accelerated architectures. Roofline micro benchmarks are specialized to quantify the behavior of different architectural features. Compared to previous work on performance characterization, these micro benchmarks focus on capturing the performance of each level of the memory hierarchy, along with thread-level parallelism(TLP), instruction-level parallelism(ILP), and explicit Single Instruction, Multiple Data(SIMD) parallelism, measured in the context of the compilers and runtime environment on the target architecture. We also developed benchmarks to explore detailed memory subsystems behaviors and evaluate parallelization overhead. Beyond on-chip performance, we measure sustained Peripheral Component Interconnect Express(PCIe) throughput with four Graphics Processing Unit(GPU) memory managed mechanisms. By combining results from the architecture characterization with the Roofline Model based solely on architectural specification, this work offers insights for performance prediction of current and future architectures and their software systems. To that end, we instrument three applications and plot their resultant performance on the corresponding Roofline Model when run on a Blue Gene/Q architecture

    Approximation anatomischer Strukturen und biomedizinischer Prozesse zur rechnergestützten Untersuchung der Hämodynamik in Aneurysmen

    Get PDF
    Arterien des Menschen können Aneurysmen aufweisen, deren Ruptur zu lebensbedrohenden inneren Blutungen wie Schlaganfällen führen kann. Ein Therapieansatz ist das Einsetzen von sogenannten Stents. Eine Ruptur oder der Einfluss eines Stents kann mit dem momentanen Stand der Technik nicht exakt vorhergesagt werden. Für eine optimale Behandlung von Patienten wäre dies allerdings eine wichtige Zusatzinformation für den behandelnden Arzt. Zur Bestimmung dieser Zusatzinformation sollen zukünftig Simulationen der Hämodynamik in pathologischen Arterien eingesetzt werden. In dieser Arbeit werden Strömungsgeschwindigkeiten in Arterien ohne beziehungsweise mit Einbringung von Einbauten wie Stents berechnet und die entstehenden Wandscherspannungen im Hinblick auf eine Rupturvorhersage untersucht. Weiterhin wird der Massentransfer zwischen Arterie und Aneurysma charakterisiert und eine Analyse des Thrombosierungsverhaltens unter Strömungseinfluss vorgenommen. Bei letztgenanntem Thema werden insbesondere der Verschluss von Aneurysmen durch Thromben, die Ortseindämmung der Thrombenbildung und das Verhalten von wandanhaftenden Thromben auch in Bezug auf eine Ablösung untersucht. Um hierfür geeignete Simulationen durchführen zu können, wird eine Analyse der biomedizinischen Grundlagen durchgeführt. Für die Untersuchung der komplexen Dynamik sind aus methodischer Sicht zwei grundlegende Aspekte zu bearbeiten: die geometrische und die funktionelle Approximation. Die funktionelle Approximation biomedizinischer Prozesse umfasst die Untersuchung der Blutströmung, des Transports von passiven Stoffen und der Thrombosierung. Hierfür werden entsprechende Modelle identifiziert, in entsprechende Lattice-Boltzmann-Verfahren umgewandelt, simuliert und untersucht. Durch die Erarbeitung geeigneter Konzepte für eine Umsetzung der hier beschriebenen Simulationen auf einzelnen oder mehreren, miteinander kommunizierenden Grafikprozessoren kann eine effiziente Simulation der gekoppelten Multi-Physik-Probleme mit Lattice-Boltzmann-Verfahren erreicht werden. Insgesamt stellt diese Vorgehensweise ein Novum dar und unterstreicht die Praktikabilität der Methode. Die geometrische Approximation anatomischer Strukturen wird in dieser Arbeit mit Level-Set-Darstellungen gelöst. Mit ihnen können vielfältige Problemstellungen im Umfeld der Simulation bearbeitet werden, dies umfasst beispielsweise die Konstruktion einer Simulationsdomäne aus unterschiedlichen Tomographiedaten und die Einbringung von Einbauten wie Stents in das Untersuchungsgebiet. Durch die Kombination mit der Lattice-Boltzmann-Methode können Vorteile gegenüber dem Stand der Technik erreicht werden, etwa bei der effizienten Berechnung der Wandscherspannungen. Eine Validierung der Strömungs- und Transportsimulationen wird mit hochaufgelöster Magnetresonanztomographie vorgenommen. Dazu wird ein Modell des Aufnahmevorgangs unter Einfluss von Radiofrequenz-Magnetfeldern und Gradienten erstellt und der Magnetisierungstransport sowie die Relaxation simuliert. Die bestimmten Abweichungen zwischen Simulation und Messung sind insgesamt gering. Für die Messexperimente werden erstmals 3D-Druckverfahren für die Konstruktion von physischen Modellen eingesetzt und deren Güte untersucht. Durch die Ergebnisse dieser Arbeit steht eine effiziente und umfassende Verarbeitungspipeline für Blutströmungs-, Transport- und Thrombosierungsprozesse für weitere Untersuchungen bereit. Sie kann ebenfalls leicht um neue Modelle erweitert werden. Die Simulation der Magnetresonanztomographie für Flussbildgebung ermöglicht ebenfalls zukünftige Anwendungen im Bereich der Sequenzentwicklung

    Towards Distributed Task-based Visualization and Data Analysis

    Get PDF
    To support scientific work with large and complex data the field of scientific visualization emerged in computer science and produces images through computational analysis of the data. Frameworks for combination of different analysis and visualization modules allow the user to create flexible pipelines for this purpose and set the standard for interactive scientific visualization used by domain scientists. Existing frameworks employ a thread-parallel message-passing approach to parallel and distributed scalability, leaving the field of scientific visualization in high performance computing to specialized ad-hoc implementations. The task-parallel programming paradigm proves promising to improve scalability and portability in high performance computing implementations and thus, this thesis aims towards the creation of a framework for distributed, task-based visualization modules and pipelines. The major contribution of the thesis is the establishment of modules for Merge Tree construction and (based on the former) topological simplification. Such modules already form a necessary first step for most visualization pipelines and can be expected to increase in importance for larger and more complex data produced and/or analysed by high performance computing. To create a task-parallel, distributed Merge Tree construction module the construction process has to be completely revised. We derive a novel property of Merge Tree saddles and introduce a novel task-parallel, distributed Merge Tree construction method that has both good performance and scalability. This forms the basis for a module for topological simplification which we extend by introducing novel alternative simplification parameters that aim to reduce the importance of prior domain knowledge to increase flexibility in typical high performance computing scenarios. Both modules lay the groundwork for continuative analysis and visualization steps and form a fundamental step towards an extensive task-parallel visualization pipeline framework for high performance computing.Wissenschaftliche Visualisierung ist eine Disziplin der Informatik, die durch computergestützte Analyse Bilder aus Datensätzen erzeugt, um das wissenschaftliche Arbeiten mit großen und komplexen Daten zu unterstützen. Softwaresysteme, die dem Anwender die Kombination verschiedener Analyse- und Visualisierungsmodule zu einer flexiblen Pipeline erlauben, stellen den Standard für interaktive wissenschaftliche Visualisierung. Die hierfür bereits existierenden Systeme setzen auf Thread-Parallelisierung mit expliziter Kommunikation, sodass das Feld der wissenschaftlichen Visualisierung auf Hochleistungsrechnern meist spezialisierten Direktlösungen überlassen wird. An dieser Stelle scheint Task-Parallelisierung vielversprechend, um Skalierbarkeit und Übertragbarkeit von Lösungen für Hochleistungsrechner zu verbessern. Daher zielt die vorliegende Arbeit auf die Umsetzung eines Softwaresystems für verteilte und task-parallele Visualisierungsmodule und -pipelines ab. Der zentrale Beitrag den die vorliegende Arbeit leistet ist die Einführung zweier Module für Merge Tree Konstruktion und topologische Datenbereinigung. Solche Module stellen bereits einen notwendigen ersten Schritt für die meisten Visualisierungspipelines dar und werden für größere und komplexere Datensätze, die im Hochleistungsrechnen erzeugt beziehungsweise analysiert werden, erwartungsgemäß noch wichtiger. Um eine Task-parallele, verteilbare Konstruktionsmethode für Merge Trees zu entwickeln musste der etablierte Algorithmus grundlegend überarbeitet werden. In dieser Arbeit leiten wir eine neue Eigenschaft für Merge Tree Knoten her und entwickeln einen neuartigen Konstruktionsalgorithmus, der gute Performance und Skalierbarkeit aufweist. Darauf aufbauend entwickeln wir ein Modul für topologische Datenbereinigung, welche wir durch neue, alternative Bereinigungsparameter erweitern, um die Flexibilität im Einstaz auf Hochleistungsrechnern zu erhöhen. Beide Module ermöglichen weiterführende Analyse und Visualisierung und setzen einen Grundstein für die Entwicklung eines umfassenden Task-parallelen Softwaresystems für Visualisierungspipelines auf Hochleistungsrechnern

    Advances in Modelling and Prediction on the Impact of Human Activities and Extreme Events on Environments

    Get PDF
    YesThis book is an edition of the Special Issue Advances in Modelling and Prediction on the Impact of Human Activities and Extreme Events on Environments that was published in Water journal

    GSI Scientific Report 2009 [GSI Report 2010-1]

    Get PDF
    Displacement design response spectrum is an essential component for the currently-developing displacement-based seismic design and assessment procedures. This paper proposes a new and simple method for constructing displacement design response spectra on soft soil sites. The method takes into account modifications of the seismic waves by the soil layers, giving due considerations to factors such as the level of bedrock shaking, material non-linearity, seismic impedance contrast at the interface between soil and bedrock, and plasticity of the soil layers. The model is particularly suited to applications in regions with a paucity of recorded strong ground motion data, from which empirical models cannot be reliably developed

    Particle Physics Reference Library

    Get PDF
    This second open access volume of the handbook series deals with detectors, large experimental facilities and data handling, both for accelerator and non-accelerator based experiments. It also covers applications in medicine and life sciences. A joint CERN-Springer initiative, the “Particle Physics Reference Library” provides revised and updated contributions based on previously published material in the well-known Landolt-Boernstein series on particle physics, accelerators and detectors (volumes 21A,B1,B2,C), which took stock of the field approximately one decade ago. Central to this new initiative is publication under full open access

    GSI Scientific Report 2009 [GSI Report 2010-1]

    Get PDF
    corecore