383 research outputs found
Surrogate-assisted Bayesian inversion for landscape and basin evolution models
The complex and computationally expensive features of the forward landscape
and sedimentary basin evolution models pose a major challenge in the
development of efficient inference and optimization methods. Bayesian inference
provides a methodology for estimation and uncertainty quantification of free
model parameters. In our previous work, parallel tempering Bayeslands was
developed as a framework for parameter estimation and uncertainty
quantification for the landscape and basin evolution modelling software
Badlands. Parallel tempering Bayeslands features high-performance computing
with dozens of processing cores running in parallel to enhance computational
efficiency. Although parallel computing is used, the procedure remains
computationally challenging since thousands of samples need to be drawn and
evaluated. In large-scale landscape and basin evolution problems, a single
model evaluation can take from several minutes to hours, and in certain cases,
even days. Surrogate-assisted optimization has been with successfully applied
to a number of engineering problems. This motivates its use in optimisation and
inference methods suited for complex models in geology and geophysics.
Surrogates can speed up parallel tempering Bayeslands by developing
computationally inexpensive surrogates to mimic expensive models. In this
paper, we present an application of surrogate-assisted parallel tempering where
that surrogate mimics a landscape evolution model including erosion, sediment
transport and deposition, by estimating the likelihood function that is given
by the model. We employ a machine learning model as a surrogate that learns
from the samples generated by the parallel tempering algorithm. The results
show that the methodology is effective in lowering the overall computational
cost significantly while retaining the quality of solutions.Comment: Under review. arXiv admin note: text overlap with arXiv:1811.0868
Solving multiphysics-based inverse problems with learned surrogates and constraints
Solving multiphysics-based inverse problems for geological carbon storage
monitoring can be challenging when multimodal time-lapse data are expensive to
collect and costly to simulate numerically. We overcome these challenges by
combining computationally cheap learned surrogates with learned constraints.
Not only does this combination lead to vastly improved inversions for the
important fluid-flow property, permeability, it also provides a natural
platform for inverting multimodal data including well measurements and
active-source time-lapse seismic data. By adding a learned constraint, we
arrive at a computationally feasible inversion approach that remains accurate.
This is accomplished by including a trained deep neural network, known as a
normalizing flow, which forces the model iterates to remain in-distribution,
thereby safeguarding the accuracy of trained Fourier neural operators that act
as surrogates for the computationally expensive multiphase flow simulations
involving partial differential equation solves. By means of carefully selected
experiments, centered around the problem of geological carbon storage, we
demonstrate the efficacy of the proposed constrained optimization method on two
different data modalities, namely time-lapse well and time-lapse seismic data.
While permeability inversions from both these two modalities have their pluses
and minuses, their joint inversion benefits from either, yielding valuable
superior permeability inversions and CO2 plume predictions near, and far away,
from the monitoring wells
Deriving Protein Structures Efficiently by Integrating Experimental Data into Biomolecular Simulations
Proteine sind molekulare Nanomaschinen in biologischen Zellen. Sie sind wesentliche Bausteine aller bekannten Lebensformen, von Einzellern bis hin zu Menschen, und erfüllen vielfältige Funktionen, wie beispielsweise den Sauerstofftransport im Blut oder als Bestandteil von Haaren. Störungen ihrer physiologischen Funktion können jedoch schwere degenerative Krankheiten wie Alzheimer und Parkinson verursachen. Die Entwicklung wirksamer Therapien für solche Proteinfehlfaltungserkrankungen erfordert ein tiefgreifendes Verständnis der molekularen Struktur und Dynamik von Proteinen. Da Proteine aufgrund ihrer lichtmikroskopisch nicht mehr auflösbaren Größe nur indirekt beobachtet werden können, sind experimentelle Strukturdaten meist uneindeutig. Dieses Problem lässt sich in silico mittels physikalischer Modellierung biomolekularer Dynamik lösen. In diesem Feld haben sich datengestützte Molekulardynamiksimulationen als neues Paradigma für das Zusammenfügen der einzelnen Datenbausteine zu einem schlüssigen Gesamtbild der enkodierten Proteinstruktur etabliert. Die Strukturdaten werden dabei als integraler Bestandteil in ein physikbasiertes Modell eingebunden. In dieser Arbeit untersuche ich, wie sogenannte strukturbasierte Modelle verwendet werden können, um mehrdeutige Strukturdaten zu komplementieren und die enthaltenen Informationen zu extrahieren. Diese Modelle liefern eine effiziente Beschreibung der aus der evolutionär optimierten nativen Struktur eines Proteins resultierenden Dynamik. Mithilfe meiner systematischen Simulationsmethode XSBM können biologische Kleinwinkelröntgenstreudaten mit möglichst geringem Rechenaufwand als physikalische Proteinstrukturen interpretiert werden. Die Funktionalität solcher datengestützten Methoden hängt stark von den verwendeten Simulationsparametern ab. Eine große Herausforderung besteht darin, experimentelle Informationen und theoretisches Wissen in geeigneter Weise relativ zueinander zu gewichten. In dieser Arbeit zeige ich, wie die entsprechenden Simulationsparameterräume mit Computational-Intelligence-Verfahren effizient erkundet und funktionale Parameter ausgewählt werden können, um die Leistungsfähigkeit komplexer physikbasierter Simulationstechniken zu optimieren. Ich präsentiere FLAPS, eine datengetriebene metaheuristische Optimierungsmethode zur vollautomatischen, reproduzierbaren Parametersuche für biomolekulare Simulationen. FLAPS ist ein adaptiver partikelschwarmbasierter Algorithmus inspiriert vom Verhalten natürlicher Vogel- und Fischschwärme, der das Problem der relativen Gewichtung verschiedener Kriterien in der multivariaten Optimierung generell lösen kann. Neben massiven Fortschritten in der Verwendung von künstlichen Intelligenzen zur Proteinstrukturvorhersage ermöglichen leistungsoptimierte datengestützte Simulationen detaillierte Einblicke in die komplexe Beziehung von biomolekularer Struktur, Dynamik und Funktion. Solche computergestützten Methoden können Zusammenhänge zwischen den einzelnen Puzzleteilen experimenteller Strukturinformationen herstellen und so unser Verständnis von Proteinen als den Grundbausteinen des Lebens vertiefen
- …