16 research outputs found

    NOVEL ALGORITHMS AND TOOLS FOR LIGAND-BASED DRUG DESIGN

    Get PDF
    Computer-aided drug design (CADD) has become an indispensible component in modern drug discovery projects. The prediction of physicochemical properties and pharmacological properties of candidate compounds effectively increases the probability for drug candidates to pass latter phases of clinic trials. Ligand-based virtual screening exhibits advantages over structure-based drug design, in terms of its wide applicability and high computational efficiency. The established chemical repositories and reported bioassays form a gigantic knowledgebase to derive quantitative structure-activity relationship (QSAR) and structure-property relationship (QSPR). In addition, the rapid advance of machine learning techniques suggests new solutions for data-mining huge compound databases. In this thesis, a novel ligand classification algorithm, Ligand Classifier of Adaptively Boosting Ensemble Decision Stumps (LiCABEDS), was reported for the prediction of diverse categorical pharmacological properties. LiCABEDS was successfully applied to model 5-HT1A ligand functionality, ligand selectivity of cannabinoid receptor subtypes, and blood-brain-barrier (BBB) passage. LiCABEDS was implemented and integrated with graphical user interface, data import/export, automated model training/ prediction, and project management. Besides, a non-linear ligand classifier was proposed, using a novel Topomer kernel function in support vector machine. With the emphasis on green high-performance computing, graphics processing units are alternative platforms for computationally expensive tasks. A novel GPU algorithm was designed and implemented in order to accelerate the calculation of chemical similarities with dense-format molecular fingerprints. Finally, a compound acquisition algorithm was reported to construct structurally diverse screening library in order to enhance hit rates in high-throughput screening

    Allosteric modulators of metabotropic glutamate receptors: from virtual screening to experimental validation

    Get PDF
    The goal of this thesis was to gain further insight into the binding behavior of ligands in the heptahelical domain (HD) of group I metabotropic glutamate receptors (mGluRs). This was realized by the establishment of strategies for the detection and optimization of molecules acting as non-competitive antagonists of group I mGluRs (mGluR1/5). These strategies should guarantee high diversity in the retrieved chemotypes of the detected compounds not resembling original reference molecules (“scaffold-hopping”). The detection of new scaffolds, in turn, was divided into two approaches: First the development of pharmacological assays to screen compounds at a certain target for bioactivity (here: affinity towards the allosteric recognition site of mGluR1 and mGluR5), and second the evaluation of computer assisted methods for the identification of virtual hits to be screened afterwards on the pharmacological assays established before. Promising molecules should be optimized with respect to activity/affinity and selectivity, their binding mode investigated and, finally, compared to existing lead compounds. Initially, membrane based binding assays for the HD of mGlu1 and mGlu5 receptors with enhanced throughput (shifting from 24-well plates to 96-well plates) were set up. For the mGluR1 assay the potent antagonist EMQMCM exhibited high affinity towards the binding site (Ki ~3nM), which is in accordance with published data from Mabire et al. (functional IC50 3nM). For mGluR5 the reference antagonist MPEP binds with high affinity to the receptor (binding IC50 13.8nM), which confirmed earlier findings from Anderson et al. (binding IC50 15nM). In another series of experiments the properties of rat cerebellar (mGluR1) and corticalmembranes (mGluR5) as well as of radiotracers were investigated by means of binding saturation studies and kinetic experiments. Furthermore, the influence of the solvent DMSO, necessary for compound screening of lipophilic substances, on positive and negative controls was evaluated. As the precise architecture of the HD of mGluR1 is still not known our efforts in identifying new ligands for this receptor focused on the ligand-based approach. All computer assisted methods that were applied to virtually screen large compound collections and to retrieve potential hits (“activity-enriched subsets”) acting at the heptahelical domain of mGluR1 relied on the existence of a valid dataset of reference molecules. This was realized by an initial compilation of a mGluR reference data collection comprising in total 357 entries predominantly negative but also some positive allosteric modulators for mGluR1 and mGluR5. In the next step a pharmacophore model for non-competitive mGluR1 antagonists was constructed. It was based upon six selective, potent and structurally diverse ligands. Prospective virtual screening was performed using the CATS atom-pair descriptor. The Asinex Gold-Collection was screened for each seed compound and some of the most similar compounds (according to the CATS descriptor) were ordered and tested forbinding affinity and functional activity at mGluR1. A high hit rate of approximately 26% (IC50 < 15 micro M) was yielded confirming the applicability of this method. One compound exerted functional activity below one micro molar (IC50-value of C-07:362nM ± 0.03). Moreover, non-linear principal component analysis was employed. Again the Asinex vendor database served as test database and was filtered by the pharmacophore model for mGluR1 established before. Test molecules that were adjacently located with mGluR1 antagonist references were selected. 15 compounds were tested on mGluR1 in binding and functional assays and three of them exhibited functional activity (IC50) below 15 micro M. The most potent molecule P-06 revealed an IC50-value of 1.11 micro M (± 0.41). The COBRA database comprising 5,376 structurally diverse bioactive molecules affecting various targets was encoded with the CATS descriptor and used for training two selforganizing maps (SOM). The encoded mGluR reference data collection was projected onto this map according to the SOM algorithm. This projection allowed to clearly distinguish between antagonists of mGluR1 and mGluR5 subtype. 28 compounds were ordered and tested on activity and affinity for mGluR1. They exhibited functional activity down to the sub-micro molar range (IC50-value of S-08: 744nM ± 0.29) yielding a final hit rate of 46% (<15 micro M). Then, the Asinex collection was screened using the SOM approach. For a predicted target panel including the muscarinic mACh (M1) receptor, the histamine H1-receptor and the dopamine D2/D3 receptors, the tested mGluR ligands exhibited the calculated binding pattern. This virtual screening concept might provide a basis for early recognition of potential sideeffects in lead discovery. We superimposed a set of 39 quinoline derivatives as non-competitive mGluR1 antagonists that were recently published by Mabire and co-workers. A CoMFA model (QSAR) was established and the influence of several side chains on functional activity was investigated. The coumarine derivative C-07 was obtained as a result of similarity searching. Starting from this compound a series of chemical derivatives was synthesized. This led to the discovery of potent (B-28, IC50: 58nM ± 0.008; Ki: 293nM ± 0.022) and selective (rmGluR5 IC50: 28.6 micro M) mGluR1 antagonists. From a homology model of mGluR1 we derived a potential binding mode for coumarines within the allosteric transmembrane region. Potential interacting patterns with amino acids were proposed considering the difference of the binding pockets between rat and human receptors. The proposed binding modes for quinolines (here:EMQMCM) and coumarines (here:B-04) were compared and discussed considering in particular the influence on activity of several side chains of quinolines obtained from the QSAR studies. The present studies demonstrated the applicability of ligand-based virtual screening for non-competitive antagonists of a G-protein coupled receptor, resulting in novel, potent and selective agents.Ziel dieser Doktorarbeit war es weiteren Einblick in das Bindungsverhalten von Liganden in der transmembranen Region von Gruppe I metabotropen Glutamatrezeptoren (mGluRs) zu gewinnen. Verwirklicht wurde dies durch den Entwurf von Strategien zur Auffindung und Optimierung von MolekĂŒlen die als nichtkompetitive Antagonisten an Gruppe I mGluRs (mGluR1/5) wirken. Diese Strategien sollten eine hohe DiversitĂ€t der chemischen Strukturen der entdeckten Verbindungen gewĂ€hrleisten und nicht den ursprĂŒnglichen ReferenzmolekĂŒlen Ă€hneln (das sogenannte „GrundgerĂŒst-Springen“). Die Auffindung neuer Kernstrukturen wiederum wurde in zwei Herangehensweisen aufgeteilt: Zum einen die Entwicklung von pharmakologischen Tests um Substanzen auf BioaktivitĂ€t an einer bestimmten Zielstruktur zu untersuchen (hier: die AffinitĂ€t zur allosterischen Bindungsstelle von mGluR1 und mGluR5), und zum anderen die Evaluierung von computergestĂŒtzten Methoden fĂŒr die Identifizierung von virtuellen Suchtreffern die dann in den zuvor etablierten pharmakologischen Testsystemen untersucht werden können. Basierend auf den hierin gemachten Ergebnissen sollten vielversprechende MolekĂŒle bezĂŒglich AktivitĂ€t, AffinitĂ€t und SelektivitĂ€t optimiert werden, ihr Bindungsmodus untersucht und schließlich mit dem von bereits bekannten Leitstrukturen verglichen werden. Anfangs wurden membranbasierte Bindungstests fĂŒr die transmembrane Region von mGluR1 und mGluR5 mit erhöhtem Durchsatz entworfen (Transfer vom 24-Lochplatten- auf 96-Lochplattenformat). In diesem Zusammenhang wurde das bereits vorhandene Wissen ĂŒber einen zur VerfĂŒgung stehenden NMDA-Rezeptor-Bindungstest genutzt. Hierbei wurde der Einfluss verschiedener Parameter wie Proteinkonzentration, Inkubationszeit, Inkubationstemperatur, etc. erforscht. Validiert wurden die Testsysteme mit AffinitĂ€tsmessungen fĂŒr Standardverbindungen: FĂŒr den mGluR1 Bindungsversuch zeigte der potente Antagonist EMQMCM hohe AffinitĂ€t an der Bindungsstelle (Ki ~3nM), was in Übereinstimmung mit publizierten Daten von Mabire et al. steht (funtioneller IC50 3nM). FĂŒr mGluR5 zeigte der Referenz-Antagonist MPEP hohe AffinitĂ€t am Rezeptor (Bindungs IC50 13,8nM) was durch frĂŒhere Untersuchungen von Anderson et al. bestĂ€tigt wird (Bindungs IC50 15nM). In einer weiteren Experimentreihe wurden die Eigenschaften von Cerebellum- Membranen (mGluR1) und Cortex-Membranen (mGluR5) der Ratte untersucht sowie die Eigenschaften eines Radioliganden, und zwar in Form von Bindungs-SĂ€ttigungsversuchen und Kinetik-Experimenten. Desweiteren wurde der Einfluss des Lösungsmittels DMSO, das fĂŒr das Lösen lipophiler Substanzen notwendig war, auf Positiv- und Negativkontrolle geprĂŒft. Da die exakte Kristallstruktur der transmembranen Region von mGluR1 noch immer unbekannt ist haben sich unsere Anstrengungen zur Identifizierung neuer Liganden fĂŒr diesen Rezeptor auf den ligandenbasierten Ansatz beschrĂ€nkt. Alle computergestĂŒtzten Methoden die fĂŒr das virtuelle Durchforsten großer Substanzdatenbanken zur Auffindung potentieller Treffer angewandt wurden (sogenannter „aktivitĂ€tsangereicherte Untergruppen“) basieren auf der Existenz eines validen Datensatzes von ReferenzmolekĂŒlen. Verwirklicht wurde dies zu Beginn durch das Zusammenstellen einer mGluR Referenzdatenbank mit 357 EintrĂ€gen, vornehmlich negative aber auch einige positive Modulatoren an mGluR1 und mGluR5. Anhand umfangreicher Suche in sachbezogener Literatur (Patente und Veröffentlichungen) wurden Angaben gesammelt. Im nĂ€chsten Schritt wurde ein Phramakophormodell fĂŒr nichtkompetitive mGluR1 Antagonisten erstellt. Es basiert auf einigen potenten, selektiven und strukturell diversen Liganden aus der mGluR Referenzdatenbank. Die Entwicklung eines aussagekrĂ€ftigen Pharmakophormodells stellte einen wichtigen Schritt dar und war Grundlage fĂŒr folgende Struktursuchen. Die dem Modell zu Grunde liegenden MolekĂŒle wiederum dienten als ReferenzmolekĂŒle fĂŒr eine auf einem topologischen Pharmakophordeskriptor basierende Ähnnlichkeitssuche: Prospektive virtuelle Suche wurde unter Benutzung des CATS Atompaar-Deskriptors durchgefĂŒhrt, einer konformationsfreien KorrelationsvektorreprĂ€sentation. Eine große Datenbank kommerziell erhĂ€ltlicher MolekĂŒle (Asinex Gold Collection: ~ 200.000 EintrĂ€ge) wurde fĂŒr jede Referenzstruktur durchsucht und einige derentsprechend dem CATS Deskriptor als am Ă€hnlichsten erachteten Verbindungen wurden bestellt und auf AktivitĂ€t und AffinitĂ€t an mGluR1 untersucht. Eine Trefferrate von ungefĂ€hr 26% (IC50 < 15 mikro M) die den Nutzen dieser Methode bestĂ€tigte, wurde erzielt. DarĂŒber hinaus wies eine Verbindung submikromolare funktionelle AktivitĂ€t auf (IC50-Wert von C-07:362nM ± 31). Da dieses Cumarin auch eine vielversprechende Kernstruktur aufwies, wurde es direkt einer Leitstrukturoptimierung unterzogen. In einer weiteren Studie wurden die Vorteile von Pharmakophorsuche und Datenreduktion anhand nichtlinearer Hauptkomponentenanalyse kombiniert. Wiederum diente die Asinex Kollektion als Testdatenbank und wurde mit dem zuvor erstellten mGluR1 Pharmakophormodell gefiltert. Die resultierende „fokussierte Datenbank“ enthielt 2211 EintrĂ€ge und wurde zusammen mit der mGluR Referenzdatenbank mit einer Vielzahl von 2D-Deskriptoren kodiert und anhand von ChemSpaceShuttle in einen dreidimensionalen Raum projiziert. Testverbindungen die in rĂ€umlicher Nachbarschaft zu mGluR1 Referenzen zu finden waren wurden ausgewĂ€hlt. Einige von ihnen wurden bestellt und auf ihre gewĂŒnschte BioaktivitĂ€t hin untersucht. Insgesamt wurden fĂŒnfzehn Verbindungen in funktionellen Tests und Bindungstest fĂŒr mGluR1 gemessen wobei drei von ihnen funktionelle AktivitĂ€t unter 15 mikro M aufwiesen. Die potenteste Verbindung P-06 zeigte einen IC50-Wert von 1,11 mikro M (± 0,41). Kohonen-Karten stellen eine Alternative zu Ähnlichkeitssuchen im Bereich der virtuellen Suche dar. Sie gruppieren MolekĂŒle indem sie Ă€hnliche Datenwerte zusammenstellen. In der vorliegenden Studie wurde die COBRA 3.12 Datenbank, die 5.376 strukturell unterschiedliche bioaktive MolekĂŒle enthĂ€lt die mit verschiedenen Rezeptoren und Enzymen wechselwirken, mit dem CATS Deskriptor verschlĂŒsselt. Dann wurden zwei selbstorganisierende Karten (SOM) damit trainiert, eine mit 100 Neuronen und eine mit 225 Neuronen. Anschließend wurde die kodierte mGluR Referenzdatenbank gemĂ€ĂŸ dem SOM Algorithmus auf diese Karten projiziert. Diese Projektion erlaubte eine klare Trennung zwischen Antagonisten vom Subtyp mGluR1 und mGluR5. Ermutigt durch diese Ergebnisse wurde die Untergruppe der mGluR1 Referenzverbindungen auf die mit der COBRA Datenbank trainierten Karten projiziert und diejenigen Neurone die die höchste Dichte an Referenzverbindungen aufwiesen ausgewĂ€hlt (Neuron 8/7 auf der kleinen Karte und 6/6 auf der großen Karte). In diesem Sinne wurde auch mit der Asinex Datenbank verfahren und alle Verbindungen die sich in beiden der eben erwĂ€hnten Neurone gruppiert haben wurden entsprechend ihrer rĂ€umlichen Entfernung zum Zentroid des jeweiligen Neurons sortiert. 28 der ersten 60 MolekĂŒlstrukuren wurden bestellt und auf AffinitĂ€t und AktivitĂ€t an mGluR1 getestet. Sie wiesen (inhibitorische) AktivitĂ€ten bis in den submikromolaren Bereich auf (IC50-Wert von S-08: 744nM ± 290) und fĂŒhrten zu einer Trefferquote von 46% (<15 mikro M). Die Anwendung der hier beschriebenen virtuellen Suchmethoden gewĂ€hrte uns eine Auswahl von selektiven mGluR1 Antagonisten mit neuen Kernstrukturen. Im folgenden wurde ihr Bindungsmodus im VerhĂ€ltnis zu dem der Referenzverbindungen untersucht und eine vielversprechende Verbindung, ein Cumarin-Derivat das durch die Ähnlichkeitssuche gefunden worden ist, wurde strukturell optimiert. Quantitative Struktur-Wirkungsbeziehung (QSAR) zielt darauf ab den Zusammenhang zwischen Ligandenstrukturen und ihren BioaktivitĂ€tsdaten quantitativ zu beschreiben. DiesbezĂŒglich haben wir einen Satz von 39 Chinolin-Derivaten der mGluR1 Antagonisten darstellt und kĂŒrzlich von Mabire und Mitarbeitern veröffentlicht wurde verwendet. Die Strukturen wurden flexibel in einer sinnvollen Anordnung ĂŒberlagert und in einen Trainingsdatensatz (30 MolekĂŒle) und einen Testdatensatz (9 MolekĂŒle) aufgeteilt. Ein CoMFA-Modell das die beste VorhersagefĂ€higkeit besaß (q2(cv): 0,617) wurde erstellt. Zur statistischen Absicherung wurde derselbe Gesamtdatensatz zehnmal per Zufallsprinzip in Trainings- (20 MolekĂŒle) und Testdatensatz (19 MolekĂŒle) aufgeteilt was in einem mittleren q2(cv) von 0,507 (± 0,036) resultierte. Nachdem fĂŒr das urprĂŒngliche Modell Konturkarten, die sterische und elektrostatische BeitrĂ€ge darstellten, berechnet worden sind wurde der Einfluss verschiedener Seitenketten auf die funktionelle AktivitĂ€t untersucht. FĂŒr einige Gruppe I mGluR Referenzverbindungen wurden, basierend auf den Ergebnissen der virtuellen Suche mit den Kohonen-Karten, SelektivitĂ€tsbetrachtungen durchgefĂŒhrt. Die Kombination eines topologischen Pharmakophor-Deskriptors (CATS) und der SOMs wurde fĂŒr die Vorhersage von multiplen Rezeptorinteraktionen von bekannten Gruppe I mGluR Antagonisten verwendet. MolekĂŒle der mGluR Referenz-Sammlung und der COBRA Datenbank, die als Testdatensatz diente, wurden mit den CATS Deskriptor kodiert und einer Klassifizierung und Projektion gemĂ€ĂŸ dem SOM Algorithmus unterzogen. FĂŒr eine vorausgesagte Auswahl an Rezeptoren, darunter der muskarinische mACh (M1) Rezeptor, der Histamin H1-Rezeptor und die Dopamin D2/D3 Rezeptoren, konnten die gemessenen mGluR Liganden die berechneten Interaktionen aufweisen. Dieses Konzept des virtuellen Suchens könnte eine Basis fĂŒr die frĂŒhe Erkennung von potentiellen Wechselwirkungen in der Arzneiforschung darstellen. Das Cumarin-Derivat C-07 wurde im Rahmen der Ähnlichkeitssuche mit dem CATS Deskriptor gefunden. Ausgehend von dieser Verbindung wurde in dem folgenden AktivitĂ€ts- Optimierungsprogramm eine Reihe von chemischen Derivaten synthetisiert. Das fĂŒhrte zur Entdeckung von potenten (B-28, IC50: 58nM ± 8; Ki: 293nM ± 22) und selektiven (rmGluR5 IC50: 28,6 mikro M) mGluR1 Antagonisten. Auf Grundlage unseres Homologiemodells haben wir einen potentiellen Bindungsmodus fĂŒr Cumarine innerhalb der transmembranen Region ermittelt, was am Beispiel von C-07 und B-28 gezeigt wurde. Es wurden potentielle Interaktionsmuster mit AminosĂ€uren vorgeschlagen, die auch den Unterschied der Bindetaschen vom Ratten- und Humanrezeptor berĂŒcksichtigen. Desweiteren wurden die vermuteten Bidungsmodi fĂŒr Chinoline (hier: EMQMCM) und Cumarine (hier: B-04) verglichen und diskutiert, und zwar unter besonderer BerĂŒcksichtigung des Einflusses von verschiedenen Chinolin-Seitenketten auf die AktivitĂ€t gemĂ€ĂŸ den vorausgegangenen QSAR Studien. Die vorliegenden Untersuchungen veranschaulichen den Nutzen von ligandbasierten virtuellen Suchen fĂŒr nichtkompetitive Antagonisten von G-Protein gekoppelten Rezeptoren was in der Auffindung neuer, potenter und selektiver Verbindungen mĂŒndete

    Transkriptiotekijöiden GATA4 ja NKX2-5 yhteisvaikutukseen kohdennettujen isoksatsoli-amidi yhdisteiden suunnittelu ja kehitys

    Get PDF
    Acute myocardial infarction is a life-threatening condition that occurs as a result of reduced blood flow in the cardiac muscle, eventually leading to tissue damage. In infarcted areas, cardiomyocytes have insufficient ability to proliferate and replace the injured cells, which is associated with a deficient pumping capacity. A strictly regulated combinatorial interplay of transcription factors, e.g., GATA4, NKX2-5, TBX5, and MEF2C, orchestrates cardiac type gene expression during the cardiomyocyte differentiation and maturation processes. The aim of the present study was to (i) characterize the protein-protein interaction of the cardiac transcription factors GATA4-NKX2-5, (ii) evaluate the chemical agents that modify the synergy of GATA4-NKX2-5 in vitro, (iii) examine the capacity of the lead compound to promote myocardial repair in vivo after myocardial infarction and other cardiac injuries and (iv) study the structural features of the compound important for metabolism and cytotoxicity. Integration of the experimental mutagenic data with computational modeling suggests that the structural architecture of the GATA4-NKX2-5 interaction resembles the protein structure of the conserved DNA binding domain of nuclear receptors. Fragment-based screening, reporter gene-based optimization and pharmacophore searching were utilized to identify the most potent lead compound targeting the GATA4-NKX2-5 interaction: N-[4- (diethylamino)phenyl]-5-methyl-3-phenylisoxazole-4-carboxamide. This compound presented anti-hypertrophic effects in vitro and cardioprotective effects in vivo. In addition, structural analysis of the lead compound revealed the signature molecular features for metabolism and cytotoxicity. Current drug treatments are able to delay, but not prevent the progress of the heart failure; therefore, modulators of protein-protein interactions of key transcription factors may represent a novel class of pharmaceuticals for cardiac remodeling and repair.Geenien ilmentymisen sÀÀtelijöihin kohdennettujen yhdisteiden suunnittelu ja kehitys SydÀninfarkti on henkeÀ uhkaava verenkierron hÀiriö, joka syntyy veren virtauksen Àkillisen vÀhentymisen seurauksena sydÀnlihaksessa aiheuttaen kudosvaurion. Vaurioituneen sydÀnlihaskudoksen kyky uusiutua tai korvata kuolleet sydÀnlihassolut uusilla on puutteellinen, ja tÀmÀn seurauksena sydÀmen pumppauskyky heikkenee. Transkriptiotekijöiden GATA4, NKX2-5, TBX5 ja MEF2C muodostamat ja koordinoimat proteiinikompleksit sÀÀtelevÀt sydÀnsolujen geenien ilmenemistÀ solujen elinkaaren aikana. VÀitöskirjatyön tavoitteena oli (i) karakterisoida geeninsÀÀtelytekijöiden GATA4-NKX2-5 molekyylirakenteet ja niiden keskinÀinen vuorovaikutus, (ii) seuloa kemiallisia yhdisteitÀ, jotka muokkaavat GATA4-NKX2-5 proteiinikompleksin aikaansaamaa geeniaktivaatiota, (iii) tutkia johtoyhdisteen vaikutuksia in vivo sydÀninfarktia ja painekuormitusta kuvaavissa elÀinmalleissa, ja (iv) tutkia johtoyhdisteen molekyylirakenteen yhteyttÀ yhdisteen aineenvaihduntaan ja soluja tuhoavaan vaikutukseen. VÀitöskirjatyö osoittaa molekyylimallinnuksen ja kokeellisen työn perusteella, ettÀ geeninsÀÀtelytekijöiden GATA4 ja NKX2-5 muodostama proteiinikompleksi jÀljittelee tumareseptoriperheeseen kuuluvien proteiinien laskostumista. Laskennallisten- ja kokeellisten mallien avulla seulottiin ja optimoitiin sitoutumisvoimakkuudeltaan lupaavin GATA4-NKX2-5 proteiinikompleksin toimintaan vaikuttava johtoyhdiste: N-[4-(dietyyliamino)fenyyli]-5-metyyli-3-fenyyli-isoksatsoli-4-karboksamidi. JohtoyhdisteellÀ havaittiin solu- ja elÀinmalleissa solujen kasvua estÀviÀ vaikutuksia in vitro ja sydÀntÀ suojaavia vaikutuksia in vivo. VÀitöskirjatyö osoitti lisÀksi aktiivisten molekyylien rakenneominaisuuksia, jotka keskeisesti vaikuttavat yhdisteiden aineenvaihduntaan ja soluja tuhoavaan vaikutukseen. Nykyinen lÀÀkehoito hidastaa, mutta ei pysÀytÀ sydÀnlihasvaurioon liittyvÀn kroonisen sydÀmen vajaatoiminnan etenemistÀ. LÀÀkevaikutuksen kohdentaminen sydÀmen keskeisten transkriptiotekijöiden yhteisvaikutukseen avaa uuden mahdollisen tutkimuslinjan sydÀnlihasvaurion estossa ja korjauksessa

    Open Source Workflow Engine for Cheminformatics: From Data Curation to Data Analysis

    Get PDF
    The recent release of large open access chemistry databases into the public domain generates a demand for flexible tools to process them so as to discover new knowledge. To support Open Drug Discovery and Open Notebook Science on top of these data resources, is it desirable for the processing tools to be Open Source and available to everyone. The aim of this project was the development of an Open Source workflow engine to solve crucial cheminformatics problems. As a consequence, the CDK-Taverna project developed in the course of this thesis builds a cheminformatics workflow solution through the combination of different Open Source projects such as Taverna (workflow engine), the Chemistry Development Kit (CDK, cheminformatics library) and Pgchem::Tigress (chemistry database cartridge). The work on this project includes the implementation of over 160 different workers, which focus on cheminformatics tasks. The application of the developed methods to real world problems was the final objective of the project. The validation of Open Source software libraries and of chemical data derived from different databases is mandatory to all cheminformatics workflows. Methods to detect the atom types of chemical structures were used to validate the atom typing of the Chemistry Development Kit and to identify curation problems while processing different public databases, including the EBI drug databases ChEBI and ChEMBL as well as the natural products Chapman & Hall Chemical Database. The CDK atom typing shows a lack on atom types of heavier atoms but fits the need of databases containing organic substances including natural products. To support combinatorial chemistry an implementation of a reaction enumeration workflow was realized. It is based on generic reactions with lists of reactants and allows the generation of chemical libraries up to O(1000) molecules. Supervised machine learning techniques (perceptron-type artificial neural networks and support vector machines) were used as a proof of concept for quantitative modelling of adhesive polymer kinetics with the Mathematica GNWI.CIP package. This opens the perspective of an integration of high-level "experimental mathematics" into the CDK-Taverna based scientific pipelining. A chemical diversity analysis based on two different public and one proprietary databases including over 200,000 molecules was a large-scale application of the methods developed. For the chemical diversity analysis different molecular properties are calculated using the Chemistry Development Kit. The analysis of these properties was performed with Adaptive-Resonance-Theory (ART 2-A algorithm) for an automatic unsupervised classification of open categorical problems. The result shows a similar coverage of the chemical space of the two databases containing natural products (one public, one proprietary) whereas the ChEBI database covers a distinctly different chemical space. As a consequence these comparisons reveal interesting white-spots in the proprietary database. The combination of these results with pharmacological annotations of the molecules leads to further research and modelling activities

    QSAR METHODS DEVELOPMENT, VIRTUAL AND EXPERIMENTAL SCREENING FOR CANNABINOID LIGAND DISCOVERY

    Get PDF
    G protein coupled receptors (GPCRs) are the largest receptor family in mammalian genomes and are known to regulate wide variety of signals such as ions, hormones and neurotransmitters. It has been estimated that GPCRs represent more than 30% of current drug targets and have attracted many pharmaceutical industries as well as academic groups for potential drug discovery. Cannabinoid (CB) receptors, members of GPCR superfamily, are also involved in the activation of multiple intracellular signal transductions and their endogenous ligands or cannabinoids have attracted pharmacological research because of their potential therapeutic effects. In particular, the cannabinoid subtype-2 (CB2) receptor is known to be involved in immune system signal transductions and its ligands have the potential to be developed as drugs to treat many immune system disorders without potential psychotic side-effects. Therefore, this work was focused on discovering novel CB2 ligands by developing novel quantitative structure-activity relationship (QSAR) methods and performing virtual and experimental screenings. Three novel QSAR methods were developed to predict biological activities and binding affinities of ligands. In the first method, a traditional fragment-based approach was improved by introducing a fragment similarity concept that enhanced the prediction accuracy remarkably. In the second method, pharmacophoric and morphological descriptors were incorporated to derive a novel QSAR regression model with good prediction accuracy. In the third method, a novel fingerprint-based artificial neural network QSAR model was developed to overcome the similar scaffold requirement of many fragment-based and other 3D-QSAR methods. These methods provide a foundation for virtual screening and hit ranking of chemical ligands from large chemical space. In addition, several novel CB2 selective ligands within nM binding affinities were discovered. These ligands were proven to be inverse agonists as validated by functional assays and could be useful probes to study CB2 signaling as well as potential drug candidates for autoimmune disesases

    Molecular Science for Drug Development and Biomedicine

    Get PDF
    With the avalanche of biological sequences generated in the postgenomic age, molecular science is facing an unprecedented challenge, i.e., how to timely utilize the huge amount of data to benefit human beings. Stimulated by such a challenge, a rapid development has taken place in molecular science, particularly in the areas associated with drug development and biomedicine, both experimental and theoretical. The current thematic issue was launched with the focus on the topic of “Molecular Science for Drug Development and Biomedicine”, in hopes to further stimulate more useful techniques and findings from various approaches of molecular science for drug development and biomedicine

    Identification of structure activity relationships in primary screening data of high-throughput screening assays

    Get PDF
    The aim of the thesis was to identify structure activity relationships (SAR) in the primary screening data of high-throughput screening (HTS) assays. The strategy was to perform a hierarchical clustering of the molecules, assign the primary screening data to the created clusters and derive models from the clusters. The models should serve to identify singletons, clusters enriched with actives, not confirmed hits and false-negatives. Two hierarchical clustering algorithms, NIPALSTREE and hierarchical k-means have been developed and adapted for this purpose, respectively. A graphical user interface (GUI) has been implemented to extract SAR from the clustering results. Retrospective and prospective applications of the clustering approach were performed. SAR models were created by combining the clustering results with different chemoinformatic methods. NIPALSTREE projects a data set onto one dimension using principle component analysis. The data set is sorted according to the scoring vector and split at the median position into two subsets. The algorithm is applied recursively onto the subsets. The hierarchical k-means recursively separates a data set into two clusters using the k-means algorithm. Both algorithms are capable of clustering large data sets with more than a million data points. They were validated and compared to each other on the basis of different structural classes. NIPALSTREE provided with the loading vectors first insights into SAR whereas the hierarchical k-means yielded superior results. A GUI was developed allowing the display of and the navigation in the clustering results. Functionalities were integrated to analyse the clusters in the dendrogram, molecules in a cluster, and physicochemical properties of a molecule. Measures were developed to identify clusters enriched with actives, to characterize singletons and to analyse selectivity and specificity. Different protease inhibitors of the COBRA database were examined using the hierarchical k-means algorithm. Supported by similarity searches and nearest neighbour analyses thrombin inhibitor singletons were quickly isolated and displayed in the dendrogram. By scaling enrichment factors to the logarithm of the dendrogram level, clusters enriched with different structural classes of factor Xa inhibitors were simultaneously identified. The observed co-clustering of other protease inhibitors provided a deeper insight into selectivity and specificity and shows the utility of the approach for constructing focussed screening libraries. Specificity was analyzed by extracting and clustering relative frequencies of the protease inhibitors from the clusters of dendrogram level 7. A unique ligand based point of view on the pocketome of the protease enzymes was obtained. To identify not confirmed hits and false-negatives in the primary screening data of HTS assays, three assays were retrospectively analysed with the hierarchical k-means algorithm. A rule catalogue was developed judging hits in terminal clusters based on the cluster size, the percent control values of the entries in a cluster, the overall hit rate, the hit rate in the cluster and the environment of a cluster in the dendrogram. It resulted in the identification of a high proportion of not confirmed hits and provided for each hit a rating in context of related non-hits. This allows prioritizing compounds for follow-up studies. Non-hits and hits were retrieved from terminal clusters containing hits. Molecules bearing false-negative scaffolds were co-extracted and enriched. To minimize the number of false-positives in the extracted lists, Bayesian regularized artificial neutral network classification models were trained with the data. Applying the models marked improvement of enrichment factors for the false-negatives was obtained. It proofs the scaffold-hopping potential of the approach. NIPALSTREE, the hierarchical k-means algorithm and self-organising maps were prospectively applied to identify novel lead candidates for dopamine D3 receptors. Compounds with novel scaffolds and low nanomolar binding affinity (65 nM, compound 42) were identified. To provide a deeper insight into the SAR of these molecules, different alternative computational methods were employed. Support vector-based regression and partial least squares were examined. Predictive models for dopamine D2 and D3 receptor binding affinity values were obtained. Important features explaining SAR were extracted from the models. The prospective application of the models to the diverse and novel virtual screening data was of limited success only. Docking studies were performed using a homology model of the dopamine D3 receptor. The visual inspection of the binding modes resulted in the hypothesis of two alternative binding pockets for the aryl moiety of dopamine D3 receptor antagonists. A pharmacophore model was created simultaneously requiring both aryl moieties. Virtual screening with the model identified a nanomolar hit (65 nM, compound 59) corroborating the hypothesis of the two binding pockets and providing a new lead structure for dopamine D3 receptors. The presented data shows that the combined approach of hierarchically clustering a data set in combination with the subsequent usage of the clusters for model generation is suited to extract SAR from screening data. The models are successful in identifying singletons, clusters enriched with actives, not confirmed hits and false-negative scaffolds.Das Ziel der Arbeit war es, Struktur-AktivitĂ€tsbeziehungen (SAR) in primĂ€ren Screeningdaten von Hochdurchsatzscreening (HTS)- Assays zu finden. Als Strategie sollten die MolekĂŒle hierarchisch geclustert werden, die primĂ€ren Screeningdaten den gebildeten Clustern zugeordnet und Modelle aus den Clustern abgeleitet werden. Die Modelle sollten das Auffinden von Singletons, mit Hits angereicherter Cluster, nicht bestĂ€tigter Hits und falsch Negativer ermöglichen. Zu diesem Zweck wurden zwei hierarchische Clusteralgorithmen, NIPALSTREE und hierarchischer k-means, entwickelt bzw. angepasst. Eine graphische BenutzeroberflĂ€che (GUI) wurde implementiert, um SAR aus den Ergebnissen der Clusterung abzuleiten. Retrospektive und prospektive Anwendungen wurden mit den ClusteransĂ€tzen verfolgt. SAR Modelle wurden durch Verwendung der Ergebnisse der Clusterung mit verschiedenen chemoinformatischen Verfahren erstellt. NIPALSTREE projiziert mit Hilfe der Hauptkomponentenanalyse einen Datensatz auf eine Dimension. Der Datensatz wird anhand des Scoringvektors sortiert und, basierend auf dem Median, in zwei Teilmengen aufgetrennt. Der Algorithmus wird rekursiv auf die neu gebildeten Mengen angewandt. Der hierarchische k-means Algorithmus trennt, basierend auf dem k-means Algorithmus, einen Datensatz rekursiv in zwei Cluster auf. Beide Algorithmen sind in der Lage, große Datenmengen mit mehr als einer Million Datenpunkte zu clustern. Sie wurden anhand verschiedener Strukturklassen validiert und miteinander verglichen. NIPALSTREE erbrachte mit dem Loadingvektor erste Einblicke in die SAR, wohingegen der hierarchische k-means zu besseren Ergebnissen fĂŒhrte. Eine GUI wurde entwickelt, die es erlaubt, die Clusterergebnisse darzustellen und darin zu navigieren. FunktionalitĂ€ten wurden bereitgestellt, um die Cluster im Dendrogramm, die MolekĂŒle eines Clusters und die physikochemischen Eigenschaften eines MolekĂŒls zu analysieren. Verfahren wurden entwickelt, um mit Hits angereicherte Cluster zu finden, Singletons zu charakterisieren und SelektivitĂ€t und SpezifitĂ€t zu analysieren. Verschiedene Proteaseinhibitoren aus der COBRA-Datenbank wurden mit dem hierarchischen k-means Algorithmus nĂ€her betrachtet. Mit Hilfe von Ähnlichkeitssuchen und nĂ€chsten Nachbaranalysen wurden Thrombininhibitorsingletons im Dendrogram in kĂŒrzester Zeit isoliert und dargestellt. Cluster, die mit verschiedenen Strukturklassen von Faktor-Xa-Inhibitoren angereichert waren, wurden, durch Skalierung des Anreicherungsfaktors auf den Logarithmus der Dendrogrammebene, gleichzeitig im Dendrogramm identifiziert. Eine Clusterung der Faktor-Xa-Inhibitoren mit anderen Proteaseinhibitoren wurde beobachtet. Sie erbrachte einen vertieften Einblick in SelektivitĂ€t und SpezifitĂ€t und zeigt die Anwendbarkeit des Ansatzes zur Erstellung fokussierter Screeningbibliotheken. Durch Extrahierung und Clusterung der relativen Anteile der Proteaseinhibitoren aus den Clustern von Dendrogrammebene sieben wurde die SpezifitĂ€t der Proteaseinhibitoren analysiert. Eine spezifische, Liganden basierte Betrachtung des Pocketoms der Proteaseenzyme wurde erhalten. Um nicht bestĂ€tigte Hits und falsch Negative in den primĂ€ren Screening Daten von HTS Assays zu finden, wurden drei Assays in Retrospektive mit dem hierarchischen k-means analysiert. Ein Regelwerk wurde entwickelt, welches Hits anhand der ClustergrĂ¶ĂŸe, des Prozent-Kontrollwertes der EintrĂ€ge eines Clusters, der Gesamthitrate, der Hitrate in einem Cluster und der Umgebung des Clusters im Dendrogramm bewertet. Das Regelwerk fĂŒhrte zum Auffindung eines großen Anteils nicht bestĂ€tigter Hits. Zudem wurde fĂŒr jeden Hit eine Bewertung im Kontext verwandter Nichthits erhalten. Dies erlaubt ein Priorisieren von MolekĂŒlen fĂŒr Folgeuntersuchungen. Nichthits und Hits wurden aus Endcluster, die Hits enthielten, extrahiert. MolekĂŒle mit falsch negativen MolekĂŒlgrundgerĂŒsten wurden koextrahiert und angereichert. Um falsch Positive in den extrahierten Listen zu minimieren, wurden Bayesische regularisierte neuronale Klassifizierungsnetze mit den Daten trainiert. Die Anwendung der Modelle ergab eine deutliche Verbesserung der Anreicherungsfaktoren der falsch Negativen. Es zeigt, dass die Methode in der Lage ist, einen MolekĂŒlgrundgerĂŒstwechsel durchzufĂŒhren. NIPALSTREE, der hierarchische k-means und selbst organisierende Karten wurden prospektiv angewandt, um neue Leitstrukturkandidaten fĂŒr Dopamin-D3-Rezeptoren zu finden. MolekĂŒle mit neuen MolekĂŒlgrundgerĂŒsten und BindungsaffinitĂ€ten im niedrigen nanomolaren Bereich wurden gefunden (65 nM fĂŒr MolekĂŒl 42). Um einen tieferen Einblick in die SAR dieser MolekĂŒle zu erhalten, wurden verschiede Computerverfahren verwendet. Supportvektorregression und PLS („partial least squares“) wurden untersucht. Es war möglich, voraussagende Modelle fĂŒr Dopamin-D2 und D3 BindungsaffinitĂ€ten zu erstellen. Die SAR erklĂ€rende MolekĂŒleigenschaften konnten aus den Modellen extrahiert werden. Die prospektive Anwendung der Modelle auf die diversen und neuen virtuellen Screeningdaten war nur von begrenztem Erfolg. Dockingstudien wurden mit einem Homologiemodell des Dopamin-D3-Rezeptors durchgefĂŒhrt. Die visuelle Begutachtung der Bindemoden fĂŒhrte zur Hypothese zweier alternativer Bindetaschen fĂŒr den Aryl-Rest von Dopamin-D3-Rezeptorantagonisten. Ein Pharmakophormodell wurde erstellt, welches beide Aryl-Reste gleichzeitig benötigt. Ein virtuelles Screening mit dem Modell identifizierte einen nanomolaren Hit (65 nM fĂŒr MolekĂŒl 59), welcher die Hypothese unterstĂŒtzt und eine neue Leitstruktur fĂŒr Dopamin-D3-Rezeptoren darstellt. Die vorgestellten Daten zeigen, dass der kombinierte Ansatz aus hierarchischer Clusterung und anschließender Verwendung der Cluster zur Modellerstellung, SAR in HTS-Daten findet. Die Modelle sind geeignet zum Auffinden von Singletons, mit Hits angereichter Cluster, nicht bestĂ€tigter Hits und falsch negativer MolekĂŒlgrundgerĂŒste

    IN SILICO METHODS FOR DRUG DESIGN AND DISCOVERY

    Get PDF
    Computer-aided drug design (CADD) methodologies are playing an ever-increasing role in drug discovery that are critical in the cost-effective identification of promising drug candidates. These computational methods are relevant in limiting the use of animal models in pharmacological research, for aiding the rational design of novel and safe drug candidates, and for repositioning marketed drugs, supporting medicinal chemists and pharmacologists during the drug discovery trajectory.Within this field of research, we launched a Research Topic in Frontiers in Chemistry in March 2019 entitled “In silico Methods for Drug Design and Discovery,” which involved two sections of the journal: Medicinal and Pharmaceutical Chemistry and Theoretical and Computational Chemistry. For the reasons mentioned, this Research Topic attracted the attention of scientists and received a large number of submitted manuscripts. Among them 27 Original Research articles, five Review articles, and two Perspective articles have been published within the Research Topic. The Original Research articles cover most of the topics in CADD, reporting advanced in silico methods in drug discovery, while the Review articles offer a point of view of some computer-driven techniques applied to drug research. Finally, the Perspective articles provide a vision of specific computational approaches with an outlook in the modern era of CADD

    Development and implementation of in silico molecule fragmentation algorithms for the cheminformatics analysis of natural product spaces

    Get PDF
    Computational methodologies extracting specific substructures like functional groups or molecular scaffolds from input molecules can be grouped under the term “in silico molecule fragmentation”. They can be used to investigate what specifically characterises a heterogeneous compound class, like pharmaceuticals or Natural Products (NP) and in which aspects they are similar or dissimilar. The aim is to determine what specifically characterises NP structures to transfer patterns favourable for bioactivity to drug development. As part of this thesis, the first algorithmic approach to in silico deglycosylation, the removal of glycosidic moieties for the study of aglycones, was developed with the Sugar Removal Utility (SRU) (Publication A). The SRU has also proven useful for investigating NP glycoside space. It was applied to one of the largest open NP databases, COCONUT (COlleCtion of Open Natural prodUcTs), for this purpose (Publication B). A contribution was made to the Chemistry Development Kit (CDK) by developing the open Scaffold Generator Java library (Publication C). Scaffold Generator can extract different scaffold types and dissect them into smaller parent scaffolds following the scaffold tree or scaffold network approach. Publication D describes the OngLai algorithm, the first automated method to identify homologous series in input datasets, group the member structures of each group, and extract their common core. To support the development of new fragmentation algorithms, the open Java rich client graphical user interface application MORTAR (MOlecule fRagmenTAtion fRamework) was developed as part of this thesis (Publication E). MORTAR allows users to quickly execute the steps of importing a structural dataset, applying a fragmentation algorithm, and visually inspecting the results in different ways. All software developed as part of this thesis is freely and openly available (see https://github.com/JonasSchaub)
    corecore