7 research outputs found

    In silico studies of nucleic acid complexes with proteins, and therapeutic small molecules.

    Get PDF
    In silico approaches to nucleic acid targeted drug discovery have been used in order to study duplex DNA, in complexes with proteins as well as more unusual form of G-rich DNA folded into higher-order structures termed as G-quadruplexes, in complexes with therapeutic small molecules. The overall aim of this work has been to provide insight into the stability, recognition, energetics of binding and dynamic behavior of these DNAs in complexes with the STAT3βtc homodimer:DNA complex and with therapeutic small molecules in G-quadruplex/pyridostatin and G-quadruplex/fragment complexes by means of combined in silico approaches. The techniques of explicit solvent molecular dynamics (MD) simulations, and subsequent calculations of the free energies of binding, molecular docking, and 3D-pharmacophore modeling have been applied to study STAT3 and G-quadruplex DNA, promising targets for anticancer therapeutic intervention. Analysis of the data obtained from multiple 50-ns MD simulations of the STAT3-DNA complexes has suggested how the transcription factor STAT3 interacts with duplex DNA, the nature of the conformational changes, and ways in which func- tion may be affected. A majority of known pathologic mutations affecting the DNA-biding region of the STAT3 have been found at the protein-DNA interface, and they have been mapped in detail. The STAT3 conformations obtained from these MD simulations have been subsequently used as a basis for a comparative multiple-target molecular docking study with an in-house library of potential STAT3 inhibitors, providing a rational of their binding in the absence of structural data. A novel “dynamic docking” approach (robust platform of numerous MD simulations) has been developed to address the G-quadruplex receptor and ligand flexibility issue, and subsequent conformational change upon binding. The strength of binding at different regions and both sites of the G-quadruplex were then closely examined. An in silico study of a fragment-based approach towards G-quadruplex stabilizing ligands has also been explored, in parallel with experimental studies, to assess whether this could provide a reliable rapid approach to finding hit fragments in the case of the c-MYC promoter quadruplex

    Application and Optimization of Contact-Guided Replica Exchange Molecular Dynamics

    Get PDF
    Proteine sind komplexe Makromoleküle, die in lebenden Organismen eine große Vielfalt an wichtigen Aufgaben erfüllen. Proteine können beispielsweise Gene regulieren, Struktur stabilisieren, Zellsignale übertragen, Substanzen transportieren und vieles mehr. Typischerweise sind umfassende Kenntnisse von Struktur und Dynamik eines Proteins erforderlich um dessen physiologische Funktion und Interaktionsmechanismen vollständig zu verstehen. Gewonnene Erkenntnisse sind für Biowissenschaften unerlässlich und können auf viele Bereiche angewendet werden, wie z.B. für Arzneimitteldesign oder zur Krankheitsbehandlung. Trotz des unfassbaren Fortschritts experimenteller Techniken bleibt die Bestimmung einer Proteinstruktur immer noch eine herausfordernde Aufgabe. Außerdem können Experimente nur Teilinformationen liefern und Messdaten können mehrdeutig und schwer zu interpretieren sein. Aus diesem Grund werden häufig Computersimulationen durchgeführt um weitere Erkenntnisse zu liefern und die Lücke zwischen Theorie und Experiment zu schließen. Heute sind viele in-silico Methoden in der Lage genaue Protein Strukturmodelle zu erzeugen, sei es mit einem de novo Ansatz oder durch Verbesserung eines anfänglichen Modells unter Berücksichtigung experimenteller Daten. In dieser Dissertation erforsche ich die Möglichkeiten von Replica Exchange Molekulardynamik (REX MD) als ein physikbasierter Ansatz zur Erzeugung von physikalisch sinnvollen Proteinstrukturen. Dabei lege ich den Fokus darauf möglichst nativähnliche Strukturen zu erhalten und untersuche die Stärken und Schwächen der angewendeten Methode. Ich erweitere die Standardanwendung, indem ich ein kontaktbasiertes Bias-Potential integriere um die Leistung und das Endergebnis von REX zu verbessern. Die Einbeziehung nativer Kontaktpaare, die sowohl aus theoretischen als auch aus experimentellen Quellen abgeleitet werden können, treibt die Simulation in Richtung gewünschter Konformationen und reduziert dementsprechend den notwendigen Rechenaufwand. Während meiner Arbeit führte ich mehrere Studien durch mit dem Ziel, die Anreicherung von nativ-ähnlichen Strukturen zu maximieren, wodurch der End-to-End Prozess von geleitetem REX MD optimiert wird. Jede Studie zielt darauf ab wichtige Aspekte der verwendeten Methode zu untersuchen und zu verbessern: 1) Ich studiere die Auswirkungen verschiedener Auswahlen von Bias-Kontakten, insbesondere die Reichweitenabhängigkeit und den negativen Einfluss von fehlerhaften Kontakten. Dadurch kann ich ermitteln, welche Art von Bias zu einer signifikanten Anreicherung von nativ-ähnlichen Konformationen führen im Vergleich zu regulärem REX. 2) Ich führe eine Parameteroptimierung am verwendeten Bias-Potential durch. Der Vergleich von Ergebnissen aus REX-Simulationen unter Verwendung unterschiedlicher sigmoidförmiger Potentiale weist mir sinnvolle Parameter Bereiche auf, wodurch ich ein ideales Bias-Potenzial für den allgemeinen Anwendungsfall ableiten kann. 3) Ich stelle eine de novo Faltungsmethode vor, die möglichst schnell viele einzigartige Startstrukturen für REX generieren kann. Dabei untersuche ich ausführlich die Leistung dieser Methode und vergleiche zwei verschiedene Ansätze zur Auswahl der Startstruktur. Das Ergebnis von REX wird stark verbessert, falls Strukturen bereits zu Beginn eine große Bandbreite des Konformationsraumes abdecken und gleichzeitig eine geringe Distanz zum angestrebten Zustand aufweisen. 4) Ich untersuche vier komplexe Algorithmusketten, die in der Lage sind repräsentative Strukturen aus großen biomolekularen Ensembles zu extrahieren, welche durch REX erzeugt wurden. Dabei studiere ich ihre Robustheit und Zuverlässigkeit, vergleiche sie miteinander und bewerte ihre erbrachte Leistung numerisch. 5) Basierend auf meiner Erfahrung mit geleitetem REX MD habe ich ein Python-Paket entwickelt um REX-Projekte zu automatisieren und zu vereinfachen. Es ermöglicht einem Benutzer das Entwerfen, Ausführen, Analysieren und Visualisieren eines REX-Projektes in einer interaktiven und benutzerfreundlichen Umgebung

    Ein Toolkit zur Quantifizierung der Stichprobenqualität von Molekül-Dynamik Trajektorien: eine Studie über hochflexible Biomoleküle

    Get PDF
    In this computational work, we investigate the sampling of molecular dynamics (MD) simulations of the two highly flexible biomolecules: Methionine-enkephalin (Met-Enkephalin) and the third variable loop (V3) of the glycoprotein 120 (gp120) from the human immunodeficiency virus type-1 (HIV-1). The conformational dynamics of the three-dimensional (3D) protein structures are of central importance for the biomolecular function. A common possibility to obtain these dynamics at atomic resolution are MD simulations. But reaching a converged MD sampling in adequate time is limited by the huge conformational space of flexible systems. Moreover, an automatic sampling validation is still not established as settled protocol in today's MD studies. Furthermore, existing tools aim primarily to investigate single trajectory convergence which is not always practical for flexible molecules. But in fact, a universal assessment is necessary to classify, whether the sampling is sufficient or not. Otherwise the extracted thermodynamic results are completely meaningless. The aim of this work is to develop a toolkit to quantitatively assess the MD sampling quality for flexible systems. This toolkit is freely available at https://github.com/MikeN12/PySamplingQuality. We use diverse sets of trajectories with different initial conformations along with enhanced sampling techniques such as accelerated MD (aMD) and scaled MD (sMD). These distort the energy landscape to ease conformational transitions. The sampling is assessed by two new quantities, the conformational Oconf and density overlap Odens, including also the cluster number Nc and cluster distribution entropy Sc. These new overlap quantities measure the self-consistency of sampling as a necessary condition for complete sampling. We use Met-Enkephalin as benchmarking system because of its small size but non-trivial dynamics. Our tool reveals that the MD sampling of already such a small molecule converges in a microsecond regime. Furthermore, we can show that aMD is the most efficient algorithm to assess the convergence and also to detect wrong sampling. However, Odens analysis comparing MD with aMD/sMD reveals that we have not completely corrected the bias from enhanced sampling. Therefore, Odens can also be used to compare different methods. On the other hand, V3 demonstrates that much more resources must be spent to achieve convergence compared to those generally invested today. The results highlight the necessity of a multi-trajectory approach to detect incomplete sampling. Altogether, we are able to generate a universally and easily applicable toolkit to assess the MD sampling quality of any kinds of multi-trajectory experiments using certain error estimates and decide, whether the extracted thermodynamic properties are correct or not.In dieser Arbeit wird das Sampling von Molekulardynamik (MD) Simulationen von zwei flexiblen Biomolekülen untersucht: Methionin-Enkephalin (Met-Enkephalin) und dem dritten variablen Loop (V3) des Glykoproteins 120 (gp120) des Humanen Immundefizienz-Virus Typ-1 (HIV-1). Die Dynamik von drei-dimensionalen (3D) Protein-Strukturen ist von zentraler Bedeutung für die Beschreibung der biomolekularen Funktion. Die Dynamik wird mittels MD Simulationen auf atomarem Level untersucht. Das Erreichen eines konvergierten MD Samplings in adäquater Zeit ist jedoch durch den riesigen Konformationsraum von flexiblen Molekülen begrenzt. Des Weiteren ist eine automatische Validierung des Samplings bisher nicht etabliert in heutigen MD Studien, und existierende Verfahren konzentrieren sich vorwiegend auf die Konvergenzanalyse einzelner Trajektorien. Dies ist für flexible Moleküle problematisch. Dabei ist es notwendig ein ausreichendes Sampling zu quantifizieren, ansonsten sind berechnete thermodynamische Größen bedeutungslos. Das Ziel dieser Arbeit ist die Entwicklung eines Toolkits, welches die Samplingqualität von MD Simulationen von flexiblen Systemen quantifiziert. Dieses ist frei verfügbar unter https://github.com/MikeN12/PySamplingQuality. Hierzu werden verschiedene Sätze von Trajektorien aus verschiedenen Startkonformationen und sogenannte Enhanced Sampling Algorithmen wie accelerated MD (aMD) und scaled MD (sMD) kombiniert. Diese modifizieren die Energielandschaften um Übergänge zu vereinfachen. Die Samplingqualität wird durch zwei neue Messungen quantifiziert, dem Konformations- Oconf und Dichteüberlapp Odens, unter Hinzunahme der Clusteranzahl Nc und der Entropie der Clusterverteilung Sc. Diese neuen Überlappgrößen klassifizieren die Selbstkonsistenz. Met-Enkephalin wird als Testsystem verwendet, aufgrund dessen geringer Peptidlänge aber dennoch hochflexiblen Verhaltens. Unser Tool zeigt, dass bereits ein so kleines Molekül Simulationen von Mikrosekunden zur Konvergenz des Samplings benötigt. Weiterhin gilt, dass aMD sowohl Konvergenz als auch ungenügendes Sampling am schnellsten erkennt. Dennoch hat der Vergleich von Odens zwischen MD und aMD/sMD gezeigt, dass die Modifikation des Enhanced Samplings nicht vollständig wiederhergestellt werden konnte. Dies kann jedoch mittels Odens untersucht werden. V3 hingegen beweist, dass viel mehr Ressourcen als gewöhnlich notwendig sind, um Konvergenz zu erhalten. Die Ergebnisse unterstreichen die Notwendigkeit eines Multitrajektorien Ansatzes, um ungenügendes Sampling eindeutig zu erkennen. Zusammenfassend ist es mit dem Toolkit möglich, das Sampling von Multitrajektorie-Experimenten zu validieren, unter der Angabe von Fehlerabschätzungen, und zu entscheiden, ob die berechneten thermodynamischen Größen korrekt beschrieben werden

    Computational Approaches to Simulation and Analysis of Large Conformational Transitions in Proteins

    Get PDF
    abstract: In a typical living cell, millions to billions of proteins—nanomachines that fluctuate and cycle among many conformational states—convert available free energy into mechanochemical work. A fundamental goal of biophysics is to ascertain how 3D protein structures encode specific functions, such as catalyzing chemical reactions or transporting nutrients into a cell. Protein dynamics span femtosecond timescales (i.e., covalent bond oscillations) to large conformational transition timescales in, and beyond, the millisecond regime (e.g., glucose transport across a phospholipid bilayer). Actual transition events are fast but rare, occurring orders of magnitude faster than typical metastable equilibrium waiting times. Equilibrium molecular dynamics (EqMD) can capture atomistic detail and solute-solvent interactions, but even microseconds of sampling attainable nowadays still falls orders of magnitude short of transition timescales, especially for large systems, rendering observations of such "rare events" difficult or effectively impossible. Advanced path-sampling methods exploit reduced physical models or biasing to produce plausible transitions while balancing accuracy and efficiency, but quantifying their accuracy relative to other numerical and experimental data has been challenging. Indeed, new horizons in elucidating protein function necessitate that present methodologies be revised to more seamlessly and quantitatively integrate a spectrum of methods, both numerical and experimental. In this dissertation, experimental and computational methods are put into perspective using the enzyme adenylate kinase (AdK) as an illustrative example. We introduce Path Similarity Analysis (PSA)—an integrative computational framework developed to quantify transition path similarity. PSA not only reliably distinguished AdK transitions by the originating method, but also traced pathway differences between two methods back to charge-charge interactions (neglected by the stereochemical model, but not the all-atom force field) in several conserved salt bridges. Cryo-electron microscopy maps of the transporter Bor1p are directly incorporated into EqMD simulations using MD flexible fitting to produce viable structural models and infer a plausible transport mechanism. Conforming to the theme of integration, a short compendium of an exploratory project—developing a hybrid atomistic-continuum method—is presented, including initial results and a novel fluctuating hydrodynamics model and corresponding numerical code.Dissertation/ThesisDoctoral Dissertation Physics 201
    corecore