38 research outputs found

    Computational prediction of metabolism: sites, products, SAR, P450 enzyme dynamics, and mechanisms.

    Get PDF
    Metabolism of xenobiotics remains a central challenge for the discovery and development of drugs, cosmetics, nutritional supplements, and agrochemicals. Metabolic transformations are frequently related to the incidence of toxic effects that may result from the emergence of reactive species, the systemic accumulation of metabolites, or by induction of metabolic pathways. Experimental investigation of the metabolism of small organic molecules is particularly resource demanding; hence, computational methods are of considerable interest to complement experimental approaches. This review provides a broad overview of structure- and ligand-based computational methods for the prediction of xenobiotic metabolism. Current computational approaches to address xenobiotic metabolism are discussed from three major perspectives: (i) prediction of sites of metabolism (SOMs), (ii) elucidation of potential metabolites and their chemical structures, and (iii) prediction of direct and indirect effects of xenobiotics on metabolizing enzymes, where the focus is on the cytochrome P450 (CYP) superfamily of enzymes, the cardinal xenobiotics metabolizing enzymes. For each of these domains, a variety of approaches and their applications are systematically reviewed, including expert systems, data mining approaches, quantitative structure-activity relationships (QSARs), and machine learning-based methods, pharmacophore-based algorithms, shape-focused techniques, molecular interaction fields (MIFs), reactivity-focused techniques, protein-ligand docking, molecular dynamics (MD) simulations, and combinations of methods. Predictive metabolism is a developing area, and there is still enormous potential for improvement. However, it is clear that the combination of rapidly increasing amounts of available ligand- and structure-related experimental data (in particular, quantitative data) with novel and diverse simulation and modeling approaches is accelerating the development of effective tools for prediction of in vivo metabolism, which is reflected by the diverse and comprehensive data sources and methods for metabolism prediction reviewed here. This review attempts to survey the range and scope of computational methods applied to metabolism prediction and also to compare and contrast their applicability and performance.JK, MJW, JT, PJB, AB and RCG thank Unilever for funding

    11th German Conference on Chemoinformatics (GCC 2015) : Fulda, Germany. 8-10 November 2015.

    Get PDF

    Virtual screening of potential bioactive substances using the support vector machine approach

    Get PDF
    Die vorliegende Dissertation stellt eine kumulative Arbeit dar, die in insgesamt acht wissenschaftlichen Publikationen (fünf publiziert, zwei eingerichtet und eine in Vorbereitung) dargelegt ist. In diesem Forschungsprojekt wurden Anwendungen von maschinellem Lernen für das virtuelle Screening von Moleküldatenbanken durchgeführt. Das Ziel war primär die Einführung und Überprüfung des Support-Vector-Machine (SVM) Ansatzes für das virtuelle Screening nach potentiellen Wirkstoffkandidaten. In der Einleitung der Arbeit ist die Rolle des virtuellen Screenings im Wirkstoffdesign beschrieben. Methoden des virtuellen Screenings können fast in jedem Bereich der gesamten pharmazeutischen Forschung angewendet werden. Maschinelles Lernen kann einen Einsatz finden von der Auswahl der ersten Moleküle, der Optimierung der Leitstrukturen bis hin zur Vorhersage von ADMET (Absorption, Distribution, Metabolism, Toxicity) Eigenschaften. In Abschnitt 4.2 werden möglichen Verfahren dargestellt, die zur Beschreibung von chemischen Strukturen eingesetzt werden können, um diese Strukturen in ein Format zu bringen (Deskriptoren), das man als Eingabe für maschinelle Lernverfahren wie Neuronale Netze oder SVM nutzen kann. Der Fokus ist dabei auf diejenigen Verfahren gerichtet, die in der vorliegenden Arbeit verwendet wurden. Die meisten Methoden berechnen Deskriptoren, die nur auf der zweidimensionalen (2D) Struktur basieren. Standard-Beispiele hierfür sind physikochemische Eigenschaften, Atom- und Bindungsanzahl etc. (Abschnitt 4.2.1). CATS Deskriptoren, ein topologisches Pharmakophorkonzept, sind ebenfalls 2D-basiert (Abschnitt 4.2.2). Ein anderer Typ von Deskriptoren beschreibt Eigenschaften, die aus einem dreidimensionalen (3D) Molekülmodell abgeleitet werden. Der Erfolg dieser Beschreibung hangt sehr stark davon ab, wie repräsentativ die 3D-Konformation ist, die für die Berechnung des Deskriptors angewendet wurde. Eine weitere Beschreibung, die wir in unserer Arbeit eingesetzt haben, waren Fingerprints. In unserem Fall waren die verwendeten Fingerprints ungeeignet zum Trainieren von Neuronale Netzen, da der Fingerprintvektor zu viele Dimensionen (~ 10 hoch 5) hatte. Im Gegensatz dazu hat das Training von SVM mit Fingerprints funktioniert. SVM hat den Vorteil im Vergleich zu anderen Methoden, dass sie in sehr hochdimensionalen Räumen gut klassifizieren kann. Dieser Zusammenhang zwischen SVM und Fingerprints war eine Neuheit, und wurde von uns erstmalig in die Chemieinformatik eingeführt. In Abschnitt 4.3 fokussiere ich mich auf die SVM-Methode. Für fast alle Klassifikationsaufgaben in dieser Arbeit wurde der SVM-Ansatz verwendet. Ein Schwerpunkt der Dissertation lag auf der SVM-Methode. Wegen Platzbeschränkungen wurde in den beigefügten Veröffentlichungen auf eine detaillierte Beschreibung der SVM verzichtet. Aus diesem Grund wird in Abschnitt 4.3 eine vollständige Einführung in SVM gegeben. Darin enthalten ist eine vollständige Diskussion der SVM Theorie: optimale Hyperfläche, Soft-Margin-Hyperfläche, quadratische Programmierung als Technik, um diese optimale Hyperfläche zu finden. Abschnitt 4.3 enthält auch eine Diskussion von Kernel-Funktionen, welche die genaue Form der optimalen Hyperfläche bestimmen. In Abschnitt 4.4 ist eine Einleitung in verschiede Methoden gegeben, die wir für die Auswahl von Deskriptoren genutzt haben. In diesem Abschnitt wird der Unterschied zwischen einer „Filter“- und der „Wrapper“-basierten Auswahl von Deskriptoren herausgearbeitet. In Veröffentlichung 3 (Abschnitt 7.3) haben wir die Vorteile und Nachteile von Filter- und Wrapper-basierten Methoden im virtuellen Screening vergleichend dargestellt. Abschnitt 7 besteht aus den Publikationen, die unsere Forschungsergebnisse enthalten. Unsere erste Publikation (Veröffentlichung 1) war ein Übersichtsartikel (Abschnitt 7.1). In diesem Artikel haben wir einen Gesamtüberblick der Anwendungen von SVM in der Bio- und Chemieinformatik gegeben. Wir diskutieren Anwendungen von SVM für die Gen-Chip-Analyse, die DNASequenzanalyse und die Vorhersage von Proteinstrukturen und Proteininteraktionen. Wir haben auch Beispiele beschrieben, wo SVM für die Vorhersage der Lokalisation von Proteinen in der Zelle genutzt wurden. Es wird dabei deutlich, dass SVM im Bereich des virtuellen Screenings noch nicht verbreitet war. Um den Einsatz von SVM als Hauptmethode unserer Forschung zu begründen, haben wir in unserer nächsten Publikation (Veröffentlichung 2) (Abschnitt 7.2) einen detaillierten Vergleich zwischen SVM und verschiedenen neuronalen Netzen, die sich als eine Standardmethode im virtuellen Screening etabliert haben, durchgeführt. Verglichen wurde die Trennung von wirstoffartigen und nicht-wirkstoffartigen Molekülen („Druglikeness“-Vorhersage). Die SVM konnte 82% aller Moleküle richtig klassifizieren. Die Klassifizierung war zudem robuster als mit dreilagigen feedforward-ANN bei der Verwendung verschiedener Anzahlen an Hidden-Neuronen. In diesem Projekt haben wir verschiedene Deskriptoren zur Beschreibung der Moleküle berechnet: Ghose-Crippen Fragmentdeskriptoren [86], physikochemische Eigenschaften [9] und topologische Pharmacophore (CATS) [10]. Die Entwicklung von weiteren Verfahren, die auf dem SVM-Konzept aufbauen, haben wir in den Publikationen in den Abschnitten 7.3 und 7.8 beschrieben. Veröffentlichung 3 stellt die Entwicklung einer neuen SVM-basierten Methode zur Auswahl von relevanten Deskriptoren für eine bestimmte Aktivität dar. Eingesetzt wurden die gleichen Deskriptoren wie in dem oben beschriebenen Projekt. Als charakteristische Molekülgruppen haben wir verschiedene Untermengen der COBRA Datenbank ausgewählt: 195 Thrombin Inhibitoren, 226 Kinase Inhibitoren und 227 Faktor Xa Inhibitoren. Es ist uns gelungen, die Anzahl der Deskriptoren von ursprünglich 407 auf ungefähr 50 zu verringern ohne signifikant an Klassifizierungsgenauigkeit zu verlieren. Unsere Methode haben wir mit einer Standardmethode für diese Anwendung verglichen, der Kolmogorov-Smirnov Statistik. Die SVM-basierte Methode erwies sich hierbei in jedem betrachteten Fall als besser als die Vergleichsmethoden hinsichtlich der Vorhersagegenauigkeit bei der gleichen Anzahl an Deskriptoren. Eine ausführliche Beschreibung ist in Abschnitt 4.4 gegeben. Dort sind auch verschiedene „Wrapper“ für die Deskriptoren-Auswahl beschrieben. Veröffentlichung 8 beschreibt die Anwendung von aktivem Lernen mit SVM. Die Idee des aktiven Lernens liegt in der Auswahl von Molekülen für das Lernverfahren aus dem Bereich an der Grenze der verschiedenen zu unterscheidenden Molekülklassen. Auf diese Weise kann die lokale Klassifikation verbessert werden. Die folgenden Gruppen von Moleküle wurden genutzt: ACE (Angiotensin converting enzyme), COX2 (Cyclooxygenase 2), CRF (Corticotropin releasing factor) Antagonisten, DPP (Dipeptidylpeptidase) IV, HIV (Human immunodeficiency virus) protease, Nuclear Receptors, NK (Neurokinin receptors), PPAR (peroxisome proliferator-activated receptor), Thrombin, GPCR und Matrix Metalloproteinasen. Aktives Lernen konnte die Leistungsfähigkeit des virtuellen Screenings verbessern, wie sich in dieser retrospektiven Studie zeigte. Es bleibt abzuwarten, ob sich das Verfahren durchsetzen wird, denn trotzt des Gewinns an Vorhersagegenauigkeit ist es aufgrund des mehrfachen SVMTrainings aufwändig. Die Publikationen aus den Abschnitten 7.5, 7.6 und 7.7 (Veröffentlichungen 5-7) zeigen praktische Anwendungen unserer SVM-Methoden im Wirkstoffdesign in Kombination mit anderen Verfahren, wie der Ähnlichkeitssuche und neuronalen Netzen zur Eigenschaftsvorhersage. In zwei Fällen haben wir mit dem Verfahren neuartige Liganden für COX-2 (cyclooxygenase 2) und dopamine D3/D2 Rezeptoren gefunden. Wir konnten somit klar zeigen, dass SVM-Methoden für das virtuelle Screening von Substanzdatensammlungen sinnvoll eingesetzt werden können. Es wurde im Rahmen der Arbeit auch ein schnelles Verfahren zur Erzeugung großer kombinatorischer Molekülbibliotheken entwickelt, welches auf der SMILES Notation aufbaut. Im frühen Stadium des Wirstoffdesigns ist es wichtig, eine möglichst „diverse“ Gruppe von Molekülen zu testen. Es gibt verschiedene etablierte Methoden, die eine solche Untermenge auswählen können. Wir haben eine neue Methode entwickelt, die genauer als die bekannte MaxMin-Methode sein sollte. Als erster Schritt wurde die „Probability Density Estimation“ (PDE) für die verfügbaren Moleküle berechnet. [78] Dafür haben wir jedes Molekül mit Deskriptoren beschrieben und die PDE im N-dimensionalen Deskriptorraum berechnet. Die Moleküle wurde mit dem Metropolis Algorithmus ausgewählt. [87] Die Idee liegt darin, wenige Moleküle aus den Bereichen mit hoher Dichte auszuwählen und mehr Moleküle aus den Bereichen mit niedriger Dichte. Die erhaltenen Ergebnisse wiesen jedoch auf zwei Nachteile hin. Erstens wurden Moleküle mit unrealistischen Deskriptorwerten ausgewählt und zweitens war unser Algorithmus zu langsam. Dieser Aspekt der Arbeit wurde daher nicht weiter verfolgt. In Veröffentlichung 6 (Abschnitt 7.6) haben wir in Zusammenarbeit mit der Molecular-Modeling Gruppe von Aventis-Pharma Deutschland (Frankfurt) einen SVM-basierten ADME Filter zur Früherkennung von CYP 2C9 Liganden entwickelt. Dieser nichtlineare SVM-Filter erreichte eine signifikant höhere Vorhersagegenauigkeit (q2 = 0.48) als ein auf den gleichen Daten entwickelten PLS-Modell (q2 = 0.34). Es wurden hierbei Dreipunkt-Pharmakophordeskriptoren eingesetzt, die auf einem dreidimensionalen Molekülmodell aufbauen. Eines der wichtigen Probleme im computerbasierten Wirkstoffdesign ist die Auswahl einer geeigneten Konformation für ein Molekül. Wir haben versucht, SVM auf dieses Problem anzuwenden. Der Trainingdatensatz wurde dazu mit jeweils mehreren Konformationen pro Molekül angereichert und ein SVM Modell gerechnet. Es wurden anschließend die Konformationen mit den am schlechtesten vorhergesagten IC50 Wert aussortiert. Die verbliebenen gemäß dem SVM-Modell bevorzugten Konformationen waren jedoch unrealistisch. Dieses Ergebnis zeigt Grenzen des SVM-Ansatzes auf. Wir glauben jedoch, dass weitere Forschung auf diesem Gebiet zu besseren Ergebnissen führen kann

    Development of Computational Methods to Predict Protein Pocket Druggability and Profile Ligands using Structural Data

    Get PDF
    This thesis presents the development of computational methods and tools using as input three-dimensional structures data of protein-ligand complexes. The tools are useful to mine, profile and predict data from protein-ligand complexes to improve the modeling and the understanding of the protein-ligand recognition. This thesis is divided into five sub-projects. In addition, unpublished results about positioning water molecules in binding pockets are also presented. I developed a statistical model, PockDrug, which combines three properties (hydrophobicity, geometry and aromaticity) to predict the druggability of protein pockets, with results that are not dependent on the pocket estimation methods. The performance of pockets estimated on apo or holo proteins is better than that previously reported in the literature (Publication I). PockDrug is made available through a web server, PockDrug-Server (http://pockdrug.rpbs.univ-paris-diderot.fr), which additionally includes many tools for protein pocket analysis and characterization (Publication II). I developed a customizable computational workflow based on the superimposition of homologous proteins to mine the structural replacements of functional groups in the Protein Data Bank (PDB). Applied to phosphate groups, we identified a surprisingly high number of phosphate non-polar replacements as well as some mechanisms allowing positively charged replacements. In addition, we observed that ligands adopted a U-shape conformation at nucleotide binding pockets across phylogenetically unrelated proteins (Publication III). I investigated the prevalence of salt bridges at protein-ligand complexes in the PDB for five basic functional groups. The prevalence ranges from around 70% for guanidinium to 16% for tertiary ammonium cations, in this latter case appearing to be connected to a smaller volume available for interacting groups. In the absence of strong carboxylate-mediated salt bridges, the environment around the basic functional groups studied appeared enriched in functional groups with acidic properties such as hydroxyl, phenol groups or water molecules (Publication IV). I developed a tool that allows the analysis of binding poses obtained by docking. The tool compares a set of docked ligands to a reference bound ligand (may be different molecule) and provides a graphic output that plots the shape overlap and a Jaccard score based on comparison of molecular interaction fingerprints. The tool was applied to analyse the docking poses of active ligands at the orexin-1 and orexin-2 receptors found as a result of a combined virtual and experimental screen (Publication V). The review of literature focusses on protein-ligand recognition, presenting different concepts and current challenges in drug discovery.Tässä väitöskirjassa esitetään tietokoneavusteisia menetelmiä ja työkaluja, jotka perustuvat proteiini-ligandikompleksien kolmiulotteisiin rakenteisiin. Ne soveltuvat proteiini-ligandikompleksien rakennetiedon louhimiseen, optimointiin ja ennustamiseen. Tavoitteena on parantaa sekä mallinnusta että käsitystä proteiini-liganditunnistuksesta. Väitöskirjassa työkalut kuvataan viitenä eri alahankkeena. Lisäksi esitetään toistaiseksi julkaisemattomia tuloksia vesimolekyylien asemoinnista proteiinien sitoutumistaskuihin. Kehitin PockDrugiksi kutsumani tilastollisen mallin, joka yhdistää kolme ominaisuutta – hydrofobisuuden, geometrian ja aromaattisuuden – proteiinitaskujen lääkekehityskohteeksi soveltuvuuden ennustamista varten siten, että tulokset ovat riippumattomia sitoutumistaskun sijoitusmenetelmästä. Apo- ja holoproteiinien taskujen ennustaminen toimii paremmin kuin alan kirjallisuudessa on aiemmin kuvattu (Julkaisu I). PockDrug on vapaasti käyttäjien saatavilla PockDrug-verkkopalvelimelta (http://pockdrug.rpbs.univ-paris-diderot.fr), jossa on lisäksi useita työkaluja proteiinin sitoutumiskohdan analyysiin ja karakterisointiin (Julkaisu II). Kehitin myös muokattavissa olevan tietokoneavusteisen prosessin, joka perustuu samankaltaisten proteiinien päällekkäin asetteluun, louhiakseni Protein Data Bankista (PDB) toiminnallisten ryhmien rakenteellisia korvikkeita. Tätä fosfaattiryhmiin soveltaessani tunnistin yllättävän paljon poolittomia fosfaattiryhmän korvikkeita ja joitakin positiivisesti varautuneita korvikkeita mahdollistavia mekanismeja. Lisäksi havaitsin, että ligandit omaksuivat U muotoisen konformaation fylogeneettisesti riippumattomien proteiinien nukleotidien sitoutumistaskuissa (Julkaisu III). Tutkin PDB:n proteiini-ligandikompleksien suolasiltojen yleisyyttä viidelle emäksiselle toiminnalliselle ryhmälle. Suolasiltojen yleisyys vaihteli guanidinium-ionin 70 prosentista tertiääristen ammoniumkationien 16 prosenttiin. Jälkimmäisessä tapauksessa suolasiltojen vähäisyys vaikuttaa riippuvan siitä, että vuorovaikuttaville ryhmille on vähemmän tilaa. Mikäli tarkastellut emäksiset ryhmät eivät osallistuneet vahvoihin karboksylaattivälitteisiin suolasiltoihin, niiden ympäristössä vaikutti olevan runsaasti happamia toiminnallisia ryhmiä, kuten hydroksi- ja fenoliryhmiä sekä vesimolekyylejä (Julkaisu IV). Lopuksi kehitin työkalun, joka mahdollistaa telakoinnista saatujen sitoutumisasentojen analyysin. Työkalu vertaa telakoitua ligandisarjaa sitoutuneeseen vertailuligandiin, joka voi olla eri molekyyli. Graafisena tulosteena saadaan diagrammi ligandien muotojen samankaltaisuudesta ja molekyylivuorovaikutusten sormenjälkiin perustuvasta Jaccard-pistemäärästä. Työkalua sovellettiin oreksiini-1- ja oreksiini-2-reseptoreille yhdistetyllä virtuaalisella ja kokeellisella seulonnalla löydettyjen aktiivisten ligandien sitoutumisasentojen analyysiin (Julkaisu V).Cette thèse présente le développement de méthodes et d’outils informatiques basés sur la structure tridimensionnelle des complexes protéine-ligand. Ces différentes méthodes sont utilisées pour extraire, optimiser et prédire des données à partir de la structure des complexes afin d’améliorer la modélisation et la compréhension de la reconnaissance entre une protéine et un ligand. Ce travail de thèse est divisé en cinq projets. En complément, une étude sur le positionnement des molécules d’eau dans les sites de liaisons a aussi été développée et est présentée. Dans une première partie un modèle statistique, PockDrug, a été mis en place. Il combine trois propriétés de poches protéiques (l’hydrophobicité, la géométrie et l’aromaticité) pour prédire la druggabilité des poches protéiques, si une poche protéique peut lier une molécule drug-like. Le modèle est optimisé pour s’affranchir des différentes méthodes d’estimation de poches protéiques. La qualité des prédictions, est meilleure à la fois sur des poches estimées à partir de protéines apo et holo et est supérieure aux autres modèles de la littérature (Publication I). Le modèle PockDrug est disponible sur un serveur web, PockDrug-Server (http://pockdrug.rpbs.univ-paris-diderot.fr) qui inclus d’autres outils pour l’analyse et la caractérisation des poches protéiques. Dans un second temps un protocole, basé sur la superposition de protéines homologues a été développé pour extraire des replacements structuraux de groupements chimiques fonctionnels à partir de la Protein Data Bank (PDB). Appliqué aux phosphates, un grand nombre de remplacements non-polaires ont été identifié pouvant notamment être chargés positivement. Quelques mécanismes de remplacements ont ainsi pu être analysé. Nous avons, par exemple, observé que le ligand adopte une configuration en forme U dans les sites de liaison des nucléotides indépendamment de la phylogénétique des protéines (Publication III). Dans une quatrième partie, la prévalence des ponts salins de cinq groupements chimiques basiques a été étudié dans les complexes protéine-ligand. Ainsi le pourcentage de pont salin fluctue de 70% pour le guanidinium à 16% pour l’amine tertiaire qui a le plus faible volume disponible autour de lui pour accueillir un group pouvant interagir. L’absence d’acide fort comme l’acide carboxylique pour former un pont salin est remplacé par un milieu enrichis en groupement chimiques fonctionnels avec des propriétés acides comme l’hydroxyle, le phénol ou encore les molécules d’eau (Publication IV). Dans un dernier temps un outil permettant l’analyse des poses de ligand obtenues par une méthode d’ancrage moléculaire a été développé. Cet outil compare ces poses à un ligand de référence, qui peut être une molécule différente en combinant l’information du chevauchement de forme de la pose et du ligand de référence et un score de Jaccard basé sur une comparaison des empreintes d’interaction moléculaires du ligand de référence et de la pose. Cette méthode a été utilisé dans l’analyse des résultats d’ancrage moléculaires pour des ligands actifs pour les récepteurs aux orexine 1 et 2. Ces ligands actifs ont été trouvés à partir de résultats combinant un criblage virtuel et expérimental. La revue de la littérature associée est focalisée sur la reconnaissance moléculaire d’un ligand pour une protéine et présente diffèrent concepts et challenges pour la recherche de nouveaux médicaments

    In silico screening on the herg potassium channel

    Get PDF
    Während des Arzneistoffentwicklungsprozesses scheitern fast 35% der Arzneistoffe wegen schlechter Absorption, Verteilung, Metabolismus, Ausscheidung und Toxizität (ADMET). Ein wichtiger Bestandteil dieses Scheiterns ist die Interaktion mit Anti-Target Proteinen wie Cytochrom P450, P-glycoprotein und dem hERG Kaliumkanal. Der hERG Kaliumkanal ist in vielen verschiedenen Zellen und Geweben wie dem Herz, Nerven und glatten Muskelzellen vorhanden. Im Herzen spielt der hERG Kanal während des Aktionspotentials in der dritten Phase der kardialen Repolarisierung wegen der Weiterleitung des schnellen Kalium Ausstroms (Ikr) eine wichtige Rolle. Ein Verzögern dieser Phase führt zum Long QT Syndrom (LQTs), das eine potenziell tödliche Arrhythmie verursachen kann. Viele Klassen von Medikamenten wurden wegen ihren Wechselwirkungen mit dem hERG Kanal in den letzten zehn Jahren vom Markt zurückgezogen. Wie auch andere Anti-Target Proteine, ist der hERG Kanal in der Ligandenerkennung unspezifisch, weshalb er mit vielen Klassen von Arzneistoffen wie Psychopharmaka, Antihistaminika, Antiarrhythmika und Antibiotika interagieren kann. Viele Studien zeigen, dass eine erhebliche Anzahl von Molekülen während der Schließung des Kanals nicht dissoziieren und im geschlossenen Zustand des hERG Kanals gefangen bleiben. In dieser Studie wurden Propafenon und dessen Derivate in ein Homologie-Modell des hERG Kanals im geschlossenen und geöffneten Zustand gedockt, um die hERG Hemmung und das „drug trapping“ besser verstehen zu können. Ziel war es, die Wechselwirkungen zwischen dem hERG Kanal im geschlossenen Zustand und den Liganden zu untersuchen. Aufgrund dessen wurde eine Serie von „trapped“ Propafenon- Derivaten im hERG Kanal, welcher sich im geschlossenen Zustand befand, mit Dock, einem Docking Modul des Programms MOE, und GLIDE, dem Docking-Programm von Schrödinger, gedockt. Es wurde ein svl-Skript, genannt ROTALI, verwendet, um RMSD Matrizen zu erstellen, mit welchen die Duplikate unter den Posen, die in Bezug auf die Central Cavity unterschiedlich positioniert waren, zu erkennen und zu löschen. In weiterer Forlge wurden die möglichen binding modes durch agglomeratives hierarchisches Clustering identifiziert. Die Analyse der Posen führte zur Identifizierung von zwei möglichen Binding Modes. Derselbe Prozess wurde angewandt, um eine Serie von Propafenon-Derivaten in ein Homologie- Modell des hERG Kanals im geöffneten Zustand zu docken. Drei mögliche Binding Modes wurden durch die agglomerative Cluster Analyse der RMSD Matrix identifiziert, welche durch das gemeinsame Gerüst der Propafenon Derivate und jenen Aminosäuren generiert wurde, die mit den Molekülen interagierten. Um die Flexibilität des Proteins zu berücksichtigen wurden die Propafenon Derivate zusätzlich in acht verschiedene Schnappschüsse einer Moleküldynamik des Homologie-Modelles des hERG Kanals im geöffneten Zustand gedockt. In diesem Fall wurden zwei Binding Modes selektiert. Interessanterweise war es durch das Einordnen der Posen der fünf oben genannten Cluster nach der potenziellen Energie des R1 Substituenten, geteilt durch die Anzahl an Schweratomen, möglich, zwischen den „Trapped“ und „non-Trapped“ Propafenon-Derivaten zu unterscheiden. Dieser Wert war bei den „non-Trapped“ Substanzen immer höher als bei den „Trapped“ Molekülen. Der Umstand, dass dies auch bei den Vertretern des fünften Clusters möglich ist, bei denen der R1 Substituent unterhalb der vier Phe656 zum Liegen kommt, deutet darauf hin, dass das Phänomen des Drug-Trappings mehr auf die inhärenten Eigenschaften des R1 Substituenten als auf seine Konformation zurückzuführen ist, wenn er mit dem hERG Kanal interagiert. Dies könnte bedeuten, dass die Starrheit und die Sperrigkeit der Substituenten bestimmt ob Propafenon und dessen Derivate „Trapped“ sind oder nicht, unabhängig vom Bindemodus im hERG Kanal.During the drug development process, almost 35% of the compounds fail due to poor absorption, distribution, metabolism, excretion and toxicity (ADMET). An important role on these failures is played by improper interactions with antitarget proteins, such as cytocrome P450, P-glycoprotein and the hERG potassium channel. The hERG potassium channel is expressed in various cells and tissues, such as heart, neurons and smooth muscle. In the heart, the hERG channel plays an important role in the third phase of heart repolarization, due to the conduction of the rapid delayed rectifier K+ current (Ikr). A delay of this phase of repolarization leads to a syndrome called Long QT syndrome (LQTs) which might cause a potentially fatal arrhythmia called Torsade de Pointes (TdP). Many different classes of compounds were withdrawn from the market in the past decade due to their interaction with the hERG channel. Similar to other antitarget proteins, the hERG channel is polyspecific in the ligand recognition, hence it can interact with many classes of compounds, such as psychiatric, antihistaminic, antiarrhytmic and antimicrobial drugs. Several studies show that some molecules do not dissociate during the channel gating and are trapped in the closed state of the hERG channel. In this study, propafenone and derivatives were docked into homology models of the hERG channel in the closed and open states to shed more light on hERG inhibition and on drug trapping. With the aim to investigate the interactions between the hERG channel in the closed state and the compounds investigated, a series of trapped propafenone derivatives were docked into the homology model of the hERG channel in the closed conformation using Dock, the docking tool of MOE, and Glide, the docking tool of Schrödinger. A svl script called ROTALI was used to generate RMSD matrices with which the duplicate poses lying in different directions of the central cavity were detected and deleted, thus allowing to identify possible binding modes through agglomerative hierarchical clustering. This analysis led to the identification of two possible binding modes. The same process was applied to the poses obtained by docking the propafenones into a homology model of the hERG channel in the open state. Three possible binding modes were selected through agglomerative cluster analysis of the RMSD matrix generated taking into account the propafenone derivatives’ common scaffold and the amino acids that might interact. Finally, in order to take into account protein flexibility, nine propafenone derivatives were docked into eight models of the hERG channel in the open state obtained from snapshots of molecular dynamics simulations. Clustering both according to the common scaffold RMSD and the RMSD matrix of the amino acids interacting with the poses, two binding modes were selected. Biological studies suggest that non-trapped propafenones hinder the hERG channel gating with a mechanism called “foot in the door”. In four out of the five selected clusters, it is possible to explain the “foot in the door” mechanism. Interestingly, ranking the poses of the five clusters above-mentioned according to the potential energy values of the R1 substituent, and according to this value divided by the number of heavy atoms, it is possible to distinguish between trapped and non-trapped propafenones. In the nontrapped compounds, this value is always higher than in the trapped ones. The fact that it works also in cluster five, where the R1 substituents are placed under the ring formed by the four Phe656, might indicate that drug trapping phenomena depend more on intrinsic properties of the R1 susbstituent rather than on its conformation when it interacts with the hERG channel. Hence, this might indicate that the rigidity and the bulkyness of the substituent determines whether a propafenone derivatives is trapped or not independently of the binding mode in the hERG channel

    Construcción QSAR de redes complejas de compuestos de interés en Química Farmacéutica, Microbiología y Parasitología

    Get PDF
    El diseño para la búsqueda y desarrollo de fármacos eficaces para el tratamiento de estas enfermedades, que supriman la eliminación o la degeneración celular respectivamente, es una de las líneas de investigación más importantes dentro de la química farmacéutica. En esto entra el diseño de fármacos; el diseño de fármacos está dedicado al desarrollo de modelos matemáticos para predecir propiedades de interés para una gran variedad de sistemas químicos incluyendo moléculas de bajo peso molecular, polímeros, biopolímeros, sistemas heterogéneos, formulaciones farmacéuticas, conglomerados de moléculas e iones, materiales, nano-estructuras y otros. Este tipo de predicciones no pretenden sustituir las técnicas experimentales sino complementar las mismas ayudando a obtener nuevas moléculas activas con mayor probabilidad de éxito, con la ventaja que ello supone en términos de ahorro de tiempo, recursos materiales, y muy importante: el refinamiento y reducción en el uso de animales de laboratorio. Esta metodología se basa en el uso de cálculos por ordenador y en las nuevas tecnologías de la informática. Las cuales pueden ser usadas: Para moléculas pequeñas: a) Estudios de relación cuantitativa estructura molecular-actividad farmacológica (QSAR) y de estructura molecular propiedades toxicológicas y eco-toxicológicas incluyendo mutagenicidad e carcinogénesis (QSTR). b) Predicción de propiedades químicas y fisicoquímicas de moléculas. Estudios de relación estructura molecular y propiedades de absorción, distribución, metabolismo y eliminación (ADME). c) Predicción de mecanismos de acción biológica de moléculas y evaluación in sílico de alta eficacia para grandes bases de datos (virtual HTS). Para macromoléculas: a) Estudios de interacción fármaco-receptor (neuronas). b) Bioinformática aplicada a estudios de relación secuencia-función y propiedades estructurales de ácidos nucleicos y proteínas. c) Búsqueda de nuevas dianas terapéuticas y “sitio activo” a partir de datos de Genómica, Proteómica. d) Búsqueda de biomarcadores para diagnóstico de enfermedades o como indicadores de contaminaciones. e) Predicción de propiedades fisicoquímicas de polímeros sintéticos, biopolímeros, materiales y nano-estructuras. f) Predicción, diseño, y optimización de enzimas mutadas para procesos biotecnológicos

    NOVEL ALGORITHMS AND TOOLS FOR LIGAND-BASED DRUG DESIGN

    Get PDF
    Computer-aided drug design (CADD) has become an indispensible component in modern drug discovery projects. The prediction of physicochemical properties and pharmacological properties of candidate compounds effectively increases the probability for drug candidates to pass latter phases of clinic trials. Ligand-based virtual screening exhibits advantages over structure-based drug design, in terms of its wide applicability and high computational efficiency. The established chemical repositories and reported bioassays form a gigantic knowledgebase to derive quantitative structure-activity relationship (QSAR) and structure-property relationship (QSPR). In addition, the rapid advance of machine learning techniques suggests new solutions for data-mining huge compound databases. In this thesis, a novel ligand classification algorithm, Ligand Classifier of Adaptively Boosting Ensemble Decision Stumps (LiCABEDS), was reported for the prediction of diverse categorical pharmacological properties. LiCABEDS was successfully applied to model 5-HT1A ligand functionality, ligand selectivity of cannabinoid receptor subtypes, and blood-brain-barrier (BBB) passage. LiCABEDS was implemented and integrated with graphical user interface, data import/export, automated model training/ prediction, and project management. Besides, a non-linear ligand classifier was proposed, using a novel Topomer kernel function in support vector machine. With the emphasis on green high-performance computing, graphics processing units are alternative platforms for computationally expensive tasks. A novel GPU algorithm was designed and implemented in order to accelerate the calculation of chemical similarities with dense-format molecular fingerprints. Finally, a compound acquisition algorithm was reported to construct structurally diverse screening library in order to enhance hit rates in high-throughput screening

    Oncological drug discovery: AI meets structure-based computational research

    Get PDF
    The integration of machine learning and structure-based methods has proven valuable in the past as a way to prioritize targets and compounds in early drug discovery. In oncological research, these methods can be highly beneficial in addressing the diversity of neoplastic diseases portrayed by the different hallmarks of cancer. Here, we review six use case scenarios for integrated computational methods, namely driver prediction, computational mutagenesis, (off)-target prediction, binding site prediction, virtual screening, and allosteric modulation analysis. We address the heterogeneity of integration approaches and individual methods, while acknowledging their current limitations and highlighting their potential to bring drugs for personalized oncological therapies to the market faster.Medicinal Chemistr

    Study of the aryl hydrocarbon receptor mediated effects through in silico modeling and in vitro bioassays

    Get PDF
    The aryl hydrocarbon receptor (AhR) is a cytoplasmatic sensor of diverse endogenous and exogenous substances. In a toxicological context, the former known as “dioxin receptor” has been investigated as a xenobiotic chemoreceptor and due to its roles in mediating carcinogenesis, endocrine disruption, among other immunological, hepatic, cardiovascular, and dermal toxicity mechanisms. The deep physiological implications of AhR in cellular proliferation, adhesion, division, differentiation, as well as in the reproductive, immunological and cardiovascular homeostasis have opened a new field of research in order to harness AhR’s pharmacological potential. Hence, AhR has become a therapeutic target of inflammatory, infectious, malignant, and immunological conditions. Toxicological and pharmacological fields could benefit from discovering novel AhR modulators to elucidate further on the chemical-biological implications of this crucial transcription factor. In this Thesis, the following objective was proposed in order to contribute to such understanding. General Objective: Evaluate diverse chemical compounds as modulators of AhR by means of in silico and in vitro methods. The general objective was concretized in specific aims distributed in the five Chapters of this Thesis as follow: Chapter 1. Review the literature on AhR mediated effects and the existing theoretical and experimental methods employed to study the structural and functional aspects of the receptor. Chapter 2. Develop and experimentally validate QSAR models to predict the AhR agonist activity of chemical compounds. Chapter 3. Analyze the dual effects of a set of benzothiazoles as AhR modulators and antimicrobial agents. Chapter 4. Evaluate a novel set of triarylmethane compounds as AhR ligands. Chapter 5. Study the AhR antagonism discovered in potentially harmful substances using computational methods.The aryl hydrocarbon receptor (AhR) is a cytoplasmatic sensor of diverse endogenous and exogenous substances. In a toxicological context, the former known as “dioxin receptor” has been investigated as a xenobiotic chemoreceptor and due to its roles in mediating carcinogenesis, endocrine disruption, among other immunological, hepatic, cardiovascular, and dermal toxicity mechanisms. The deep physiological implications of AhR in cellular proliferation, adhesion, division, differentiation, as well as in the reproductive, immunological and cardiovascular homeostasis have opened a new field of research in order to harness AhR’s pharmacological potential. Hence, AhR has become a therapeutic target of inflammatory, infectious, malignant, and immunological conditions. Toxicological and pharmacological fields could benefit from discovering novel AhR modulators to elucidate further on the chemical-biological implications of this crucial transcription factor. In this Thesis, the following objective was proposed in order to contribute to such understanding. General Objective: Evaluate diverse chemical compounds as modulators of AhR by means of in silico and in vitro methods. The general objective was concretized in specific aims distributed in the five Chapters of this Thesis as follow: Chapter 1. Review the literature on AhR mediated effects and the existing theoretical and experimental methods employed to study the structural and functional aspects of the receptor. Chapter 2. Develop and experimentally validate QSAR models to predict the AhR agonist activity of chemical compounds. Chapter 3. Analyze the dual effects of a set of benzothiazoles as AhR modulators and antimicrobial agents. Chapter 4. Evaluate a novel set of triarylmethane compounds as AhR ligands. Chapter 5. Study the AhR antagonism discovered in potentially harmful substances using computational methods
    corecore