10 research outputs found

    Large-scale Ferrofluid Simulations on Graphics Processing Units

    Full text link
    We present an approach to molecular-dynamics simulations of ferrofluids on graphics processing units (GPUs). Our numerical scheme is based on a GPU-oriented modification of the Barnes-Hut (BH) algorithm designed to increase the parallelism of computations. For an ensemble consisting of one million of ferromagnetic particles, the performance of the proposed algorithm on a Tesla M2050 GPU demonstrated a computational-time speed-up of four order of magnitude compared to the performance of the sequential All-Pairs (AP) algorithm on a single-core CPU, and two order of magnitude compared to the performance of the optimized AP algorithm on the GPU. The accuracy of the scheme is corroborated by comparing the results of numerical simulations with theoretical predictions

    Development and Application of Numerical Methods in Biomolecular Solvation

    Full text link
    This work addresses the development of fast summation methods for long range particle interactions and their application to problems in biomolecular solvation, which describes the interaction of proteins or other biomolecules with their solvent environment. At the core of this work are treecodes, tree-based fast summation methods which, for N particles, reduce the cost of computing particle interactions from O(N^2) to O(N log N). Background on fast summation methods and treecodes in particular, as well as several treecode improvements developed in the early stages of this work, are presented. Building on treecodes, dual tree traversal (DTT) methods are another class of tree-based fast summation methods which reduce the cost of computing particle interactions for N particles to O(N). The primary result of this work is the development of an O(N) dual tree traversal fast summation method based on barycentric Lagrange polynomial interpolation (BLDTT). This method is implemented to run across multiple GPU compute nodes in the software package BaryTree. Across different problem sizes, particle distributions, geometries, and interaction kernels, the BLDTT shows consistently better performance than the previously developed barycentric Lagrange treecode (BLTC). The first major biomolecular solvation application of fast summation methods presented is to the Poisson–Boltzmann implicit solvent model, and in particular, the treecode-accelerated boundary integral Poisson–Boltzmann solver (TABI-PB). The work on TABI-PB consists of three primary projects and an application. The first project investigates the impact of various biomolecular surface meshing codes on TABI-PB, and integrated the NanoShaper software into the package, resulting in significantly better performance. Second, a node patch method for discretizing the system of integral equations is introduced to replace the previous centroid collocation scheme, resulting in faster convergence of solvation energies. Third, a new version of TABI-PB with GPU acceleration based on the BLDTT is developed, resulting in even more scalability. An application investigating the binding of biomolecular complexes is undertaken using the previous Taylor treecode-based version of TABI-PB. In addition to these projects, work performed over the course of this thesis integrated TABI-PB into the popular Adaptive Poisson–Boltzmann Solver (APBS) developed at Pacific Northwest National Laboratory. The second major application of fast summation methods is to the 3D reference interaction site model (3D-RISM), a statistical-mechanics based continuum solvation model. This work applies cluster-particle Taylor expansion treecodes to treat long-range asymptotic Coulomb-like potentials in 3D-RISM, and results in significant speedups and improved scalability to the 3D-RISM package implemented in AmberTools. Additionally, preliminary work on specialized GPU-accelerated treecodes based on BaryTree for 3D-RISM long-range asymptotic functions is presented.PHDApplied and Interdisciplinary MathematicsUniversity of Michigan, Horace H. Rackham School of Graduate Studieshttp://deepblue.lib.umich.edu/bitstream/2027.42/168120/1/lwwilson_1.pd

    Hierarchical boundary element method based on the Barnes-Hut tree applied to exterior creeping flow

    Get PDF
    En este trabajo se exponen un método de elementos de borde en una variante jerárquica y su empleo en flujo de Stokes alrededor de cuerpos rígidos tridimensionales en régimen estacionario. La propuesta se basa en el algoritmo jerárquico de bajo orden descendente y autoadaptativo de Barnes-Hut, que se emplea junto con una formulación integral de contorno indirecta y de segunda clase cuyo término fuente es función de la velocidad no perturbada. El campo solución es la densidad superficial de capa doble modificada para completar el espectro de autovalores del operador integral. De esta manera, los modos rígidos son eliminados y se pueden representar una fuerza y una cupla no nulas sobre el cuerpo. Los elementos son triángulos planos de bajo orden y se emplea una resolución iterativa mediante residuo mínimo generalizado (GMRES) sin precondicionamiento. Los ejemplos numéricos incluyen casos con soluciones analíticas, cuerpos con aristas y vértices o con formas intrincadas. La ventaja principal de la técnica desarrollada se halla en la posibilidad de considerar un número de grados de libertad mayor respecto a los que pueden emplearse con los métodos de colocación al centroide más tradicionales, debido a la disminución de la demanda de memoria primaria y de los tiempos de cómputo.In this work, a hierarchical variant of a boundary element method and its use in Stokes flow around three-dimensional rigid bodies in steady regime is presented. The proposal is based on the descending hierarchical low-order and self-adaptive algorithm of Barnes-Hut, and it is used in conjunction with an indirect boundary integral formulation of second class, whose source term is a function of the undisturbed velocity. The solution field is the double layer surface density, which is modified in order to complete the eigenvalue spectrum of the integral operator. In this way, the rigid modes are eliminated and both a non-zero force and a non-null torque on the body could be calculated. The elements are low order flat triangles, and an iterative solution by generalized minimal residual (GMRES) is used. Numerical examples include cases with analytical solutions, bodies with edges and vertices, or with intricate shapes. The main advantage of the presented technique is the possibility of considering a greater number of degrees of freedom regarding traditional collocation methods, due to the decreased demand of main memory and the reduction in the computation times.Fil: Sarraf, Sofia Soledad. Universidad Nacional del Comahue. Facultad de Ingeniería. Departamento de Mecánica; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Centro de Investigaciones En Metodos Computacionales. Universidad Nacional del Litoral. Centro de Investigaciones En Metodos Computacionales; ArgentinaFil: D'elia, Jorge. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Desarrollo Tecnológico para la Industria Química. Universidad Nacional del Litoral. Instituto de Desarrollo Tecnológico para la Industria Química; ArgentinaFil: Battaglia, Laura. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Desarrollo Tecnológico para la Industria Química. Universidad Nacional del Litoral. Instituto de Desarrollo Tecnológico para la Industria Química; Argentina. Universidad Tecnologica Nacional; ArgentinaFil: Lopez, Ezequiel Jose. Universidad Nacional del Comahue. Facultad de Ingeniería. Departamento de Mecánica; Argentina. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentin

    Algorithmique hiérarchique parallèle haute performance pour les problèmes à N-corps

    Get PDF
    Cette thèse porte sur la méthode dite « méthode multipôle rapide » qui résout hiérarchiquement le problème à N-corps avec une complexité linéaire pour n'importe quelle précision. Dans le cadre de l'équation de Laplace, nous souhaitons pouvoir traiter efficacement toutes les distributions de particules rencontrées en astrophysique et en dynamique moléculaire. Nous étudions tout d'abord deux expressions distinctes du principal opérateur (« multipôle-to-local ») ainsi que les bornes d'erreur associées. Pour ces deux expressions, nous présentons une formulation matricielle dont l'implémentation avec des routines BLAS (Basic Linear Algebra Subprograms) permet d'améliorer fortement l'efficacité de calcul. Dans la gamme de précisions qui nous intéresse, cette approche se révèle plus performante que les améliorations existantes (FFT, rotations et ondes planes), pour des distributions uniformes ou non. Outre une nouvelle structure de données pour l'octree sous-jacent et des contributions algorithmiques à la version adaptative, nous avons aussi efficacement parallélisé notre méthode en mémoire partagée et en mémoire distribuée. Enfin, des comparaisons avec des codes dédiés justifient l'intérêt de notre code pour des simulations en astrophysique

    Relaxationsprozesse in stark gekoppelten ultrakalten Plasmen

    Get PDF
    Typischerweise sind Plasmen extrem heiß - diese hohen Energien sind nötig, um die Ionisationsschwelle der Atome zu überwinden und damit einen stabilen Plasmazustand zu gewährleisten. Folglich werden die physikalischen Eigenschaften dieser Plasmen für gewöhnlich durch die thermischen Energie der Plasmateilchen bestimmt, während Korrelationen zwischen den Ladungen eine untergeordnete Rolle spielen. Durch die rasanten Fortschritte auf dem Gebiet der ultrakalten Gase ist es jedoch ebenso möglich, Plasmen bei extrem tiefen Temperaturen zu erzeugen, indem lasergekühlte Atome photoionisiert werden. In diesen ultrakalten Plasmen (UKP) lassen sich aufgrund der niedrigen Temperaturen bereits deutliche Auswirkungen von Korrelationen beobachten, die zu gänzlich anderer Dynamik führen können als aus dem Bereich der heißen schwach gekoppelten Plasmen bekannt. Ähnliche Prozesse werden auch in dichten Plasmen beobachtet, in denen durch extrem kurzen Teilchenabstände die Wechselwirkungsenergie auch bei Temperaturen von über 10000 Kelvin die kinetische Energie dominiert. Dichte Plasmen spielen eine wichtige Rolle für technische Anwendungen wie die Trägheitsfusion. Im Gegensatz zu diesen dichten Plasmen realisieren UKP starke Korrelationen jedoch bei sehr viel geringen Dichten von ρ ∼ 10^9 cm^{−3} . Die daraus resultierende langsame Dynamik ist experimentell wesentlich besser zugänglich und macht diese System deshalb besonders interessant, um Korrelationseffekte in stark gekoppelten Plasmen zu studieren. Diese Arbeit beschäftigt sich mit Effekten von starken Korrelationen auf verschiedene Relaxationsprozesse, die insbesondere, aber nicht ausschließlich in UKP eine bedeutende Rolle spielen. Neben dem fundamentalen Interesse an diesen Prozessen gilt ein Augenmerk auch möglichen experimentellen Tests der getroffenen Vorhersagen. Da die Theorie der schwach gekoppelten Plasmen Korrelationen größtenteils vernachlässigt, ist sie im Regime der UKP nur eingeschränkt anwendbar. Zur Berücksichtigung der starken Korrelationen werden in dieser Arbeit umfangreiche molekulardynamischen Simulationen eingesetzt, die teilweise mit quantenmechanischen Beschreibungen kombiniert werden, um den in UKP relevanten atomphysikalischen Aspekten gerecht zu werden. Im Rahmen dieser Rechnungen wird zunächst die seit langem ungeklärte Frage der Atombildung bei tiefen Temperaturen beantwortet. Dieser Prozess ist für UKP besonders relevanten, da die Rekombination die Lebensdauer des Plasmas bestimmt. Die konventionelle Theorie für Rekombination basiert auf der Annahme von von isolierten Drei-Körper-Stößen. Die daraus resultierende Rate divergiert mit abnehmender Temperatur und verliert daher ihre Gültigkeit im ultrakalten Bereich. In dieser Arbeit wird die Beschreibung der Rekombination mit Hilfe aufwendiger Vielteilchen-Simulationen auf den stark gekoppelte Bereich ausgebaut. Hierbei zeigt sich, dass die Rekombinationsrate im Bereich tiefer Temperaturen auf einen konstanten Wert konvergiert, so dass das Problem der divergierenden Rate gelöst werden kann. Ein weiteres, seit langem kontrovers diskutiertes Problem, stellt die Relaxation aufgrund von elastischen Stößen in stark gekoppelten Plasmen dar. Auch hier gilt, dass die konventionelle Theorie für heiße Plasmen, die auf Landau und Spitzer zurückgeht, aufgrund der Vernachlässigung von Korrelationen im Regime starker Kopplung unzureichend wird. Bisher waren keine experimentellen Ergebnisse verfügbar, um die verschiedenen Vorschläge zur Erweiterung der Landau-Spitzer-Beschreibung auf den stark gekoppelten Bereich zu beurteilen. In enger Zusammenarbeit mit der Gruppe von Prof. T. C. Killian (Rice University, Houston, USA) können im Rahmen dieser Arbeit nun erstmals Relaxationsraten in stark gekoppelten Plasmen gemessen werden. Dazu wird mittels eines Pump-Probe-Verfahren die Relaxation der ionischen Geschwindigkeitsverteilung in UKP beobachtet. In dieser Arbeit konnte eine Methode zur Interpretation der experimentellen Daten entwickelt und durch semiklassische Simulationen der Parameterbereich enorm erweitert werden. Unsere Ergebnisse zeigen, dass die Landau-Spitzer-Theorie bereits bei geringen Kopplungsstärken deutliche Defizite aufweist und liefern erstmalig Vorhersagen im stark gekoppelten Bereich. Bei der Untersuchung der ionischen Relaxation wird deutlich, dass insbesondere experimentelle Ergebnisse bei hohen Kopplungsstärken von Interesse sind. Derzeit sind typische UKP-Experimente jedoch auf mäßige Kopplungsstärken limitiert. Ursache hierfür ist, dass das Plasma in einem Zustand weit entfernt vom Gleichgewicht erzeugt wird. Bei der Relaxation ins Gleichgewicht kommt es zu einer Ausbildung von Korrelationen und damit zu einer Umwandlung von potentieller in kinetische Energie. In dieser Arbeit wird deshalb ein neues Plasmaherstellungsverfahren vorgeschlagen, das für die Ionen dieses „Korrrelationsheizen“ stark unterdrücken kann. Durch eine kollektive Anregung kalter Atome in Rydberg-Zustände werden vor der Photoionsation der Atome Korrelationen im atomaren Gas induziert. Es wird gezeigt, dass diese Korrelationen durch eine selektive Ionisation der Rydberg-Atome mit Hilfe von Mikrowellen an das Plasma weitergegeben werden können. Dadurch verringert sich das Korrelationsheizen und eröffnet neue Perspektiven für Untersuchungen ultrakalter Plasmen tief im stark gekoppelten Regime

    MS FT-2-2 7 Orthogonal polynomials and quadrature: Theory, computation, and applications

    Get PDF
    Quadrature rules find many applications in science and engineering. Their analysis is a classical area of applied mathematics and continues to attract considerable attention. This seminar brings together speakers with expertise in a large variety of quadrature rules. It is the aim of the seminar to provide an overview of recent developments in the analysis of quadrature rules. The computation of error estimates and novel applications also are described

    Generalized averaged Gaussian quadrature and applications

    Get PDF
    A simple numerical method for constructing the optimal generalized averaged Gaussian quadrature formulas will be presented. These formulas exist in many cases in which real positive GaussKronrod formulas do not exist, and can be used as an adequate alternative in order to estimate the error of a Gaussian rule. We also investigate the conditions under which the optimal averaged Gaussian quadrature formulas and their truncated variants are internal
    corecore