114 research outputs found

    Virtual screening applied in several series of bioactive heterocyclic molecules

    Get PDF
    Malaria is one of the most widespread and fearsome parasitic disease in the world. Plasmodium falciparum is the parasite that causes the most severe type of malaria, this species transmits in the human body and attack the important organ; which is the human liver cells, will then reenter the blood stream and begin infecting the red blood cells. The major enzymes in this parasite is Plasmodium falciparum dihydrofolatereductase (PfDHFR), it is responsible for the biosynthesis of essential amino acids and nucleotide bases. The emergence of resistance of this kind of parasite to antimalarial agents had led for several years, still represents a threat, which draws our attention for the adoption of new guidelines for the treatment of malaria cases of P. falciparum species. For this reason, in this thesis we focus light on the discovery and development of Sym-triazine derivatives, which have provided a class of antimalarial drugs highly effective against PfDHFR. In this context, it is necessary to focus on Virtual Screening computational approaches in the fields of target identification and lead discovery. The aim of our study was to apply this type of in silico methodology, with the aim of modelling and evaluating for screening bioactive molecules derived from Sym-triazine. Our work combined between ligand-based VS methods; we based on the QSARs methods Two-dimensional (2D-QSAR(MLR/ANN)) and a three-dimensional stereo (3DQSAR( PLS)) which contains effective biological properties. The both of methods coupled with a Virtual Screening examination, by using a technique similarity search. Subsequently, we confirm the powerful and robustness of developed QSAR models by using various statistical OECD principles for the validation; internal and external validation (for training and test set), Y-randomization, and exploit of applicability domain. And structure-based VS methods; we concretized on the molecular docking analysis to determine the best interactions of the most active compound or the reference ligand which form stable complexes with the PfDHFR enzyme. The final results of our study, these different in silico methods allowed us to identify 9 new derivatives of Sym-triazine from both studies, show excellent inhibitory concentration activities against resistant P. falciparum bearing the mutant enzymes, making them good candidates for further development as antimalarial drugs

    Application of Medicinal Chemistry Methods on Different Classes of Drugs

    Get PDF
    The present doctoral thesis is the result of the work carried out during the three years of my PhD scholarship at the Rome Center for Molecular Design laboratory (RCMD, Department of Chemistry and Drug Technologies, Sapienza University of Rome), under the supervision of Prof. Rino Ragno. The research activity was focused mainly on the design, optimization and application of computational strategies to derive quantitative structure-activity relationships (QSAR, 3-D QSAR, and COMBINE) on different molecular classes of current interest, such as: opioid receptor antagonists (OPAs), Hepatitis C Virus NS5B-Polymerase Inhibitors (NS5B-NNIs), Hystone Deacetylase Inhibitors (HDACIs), Anti- tubercular agents, vascular endothelial growth factor receptor-2 (VEGFR-2) inhibitors, HSP90 inhibitors, HIV-1 reverse transcriptase inhibitors (NNRTIs), Bovine Serum Amine Oxidase (BSAO) substrates, etc... Moreover two research periods abroad were performed: the first framed in a LLP Erasmus program collaboration, was conducted for six months at the Laboratoire d'Ingénierie et Moléculaire Pharmacologique Biochimie (LIMBP) of the Université de Lorraine Metz (France), directed by Prof. Gilbert Kirsch, and characterized by the application of organic synthesis to obtain new thienopyrimidinone derivatives as potential inhibitors of vascular endothelial growth factor receptor-2 (VEGFR-2); the second took place, for three months, at the Department of Biochemistry and Molecular Biophysics in Washington University School of Medicine in Saint Louis (MO, USA), under the supervision of Prof. Garland R. Marshall, investigating the activity profile of new Histone Deacetylases (HDACs) inhibitors by the application of the Mobility Shift Assay Technology. Main purpose of this doctoral thesis is to highlight the activities carried out in the different research projects, the applied methodologies and the obtained results. The text starts describing those studies whose results were published in scientific journals (chapters I-VI): the author decided to omit some procedural details, completely reported in the published papers, that would make the text too long, tedious and redundant; therefore readers who want to delve these aspects can also refer to Chapter XII in which is possible to read the original papers; on the contrary for studies that have not yet been published, as those characterizing the Chapters VII and VIII, discussion is adequately detailed. Chapters IX and X report the scientific activities carried out in France and in USA respectively; Chapter XI summarizes all the scientific activities accomplished during the entire PhD course, whereas Chapter XII, as mentioned, contains the published articles

    Application of Medicinal Chemistry Methods on Different Classes of Drugs

    Get PDF
    The present doctoral thesis is the result of the work carried out during the three years of my PhD scholarship at the Rome Center for Molecular Design laboratory (RCMD, Department of Chemistry and Drug Technologies, Sapienza University of Rome), under the supervision of Prof. Rino Ragno. The research activity was focused mainly on the design, optimization and application of computational strategies to derive quantitative structure-activity relationships (QSAR, 3-D QSAR, and COMBINE) on different molecular classes of current interest, such as: opioid receptor antagonists (OPAs), Hepatitis C Virus NS5B-Polymerase Inhibitors (NS5B-NNIs), Hystone Deacetylase Inhibitors (HDACIs), Anti- tubercular agents, vascular endothelial growth factor receptor-2 (VEGFR-2) inhibitors, HSP90 inhibitors, HIV-1 reverse transcriptase inhibitors (NNRTIs), Bovine Serum Amine Oxidase (BSAO) substrates, etc... Moreover two research periods abroad were performed: the first framed in a LLP Erasmus program collaboration, was conducted for six months at the Laboratoire d'Ingénierie et Moléculaire Pharmacologique Biochimie (LIMBP) of the Université de Lorraine Metz (France), directed by Prof. Gilbert Kirsch, and characterized by the application of organic synthesis to obtain new thienopyrimidinone derivatives as potential inhibitors of vascular endothelial growth factor receptor-2 (VEGFR-2); the second took place, for three months, at the Department of Biochemistry and Molecular Biophysics in Washington University School of Medicine in Saint Louis (MO, USA), under the supervision of Prof. Garland R. Marshall, investigating the activity profile of new Histone Deacetylases (HDACs) inhibitors by the application of the Mobility Shift Assay Technology. Main purpose of this doctoral thesis is to highlight the activities carried out in the different research projects, the applied methodologies and the obtained results. The text starts describing those studies whose results were published in scientific journals (chapters I-VI): the author decided to omit some procedural details, completely reported in the published papers, that would make the text too long, tedious and redundant; therefore readers who want to delve these aspects can also refer to Chapter XII in which is possible to read the original papers; on the contrary for studies that have not yet been published, as those characterizing the Chapters VII and VIII, discussion is adequately detailed. Chapters IX and X report the scientific activities carried out in France and in USA respectively; Chapter XI summarizes all the scientific activities accomplished during the entire PhD course, whereas Chapter XII, as mentioned, contains the published articles

    Mass spectrometric characterization of flavonoids and in vitro intestinal transport and bioactivity

    Get PDF

    Enumeration, conformation sampling and population of libraries of peptide macrocycles for the search of chemotherapeutic cardioprotection agents

    Get PDF
    Peptides are uniquely endowed with features that allow them to perturb previously difficult to drug biomolecular targets. Peptide macrocycles in particular have seen a flurry of recent interest due to their enhanced bioavailability, tunability and specificity. Although these properties make them attractive hit-candidates in early stage drug discovery, knowing which peptides to pursue is non‐trivial due to the magnitude of the peptide sequence space. Computational screening approaches show promise in their ability to address the size of this search space but suffer from their inability to accurately interrogate the conformational landscape of peptide macrocycles. We developed an in‐silico compound enumerator that was tasked with populating a conformationally laden peptide virtual library. This library was then used in the search for cardio‐protective agents (that may be administered, reducing tissue damage during reperfusion after ischemia (heart attacks)). Our enumerator successfully generated a library of 15.2 billion compounds, requiring the use of compression algorithms, conformational sampling protocols and management of aggregated compute resources in the context of a local cluster. In the absence of experimental biophysical data, we performed biased sampling during alchemical molecular dynamics simulations in order to observe cyclophilin‐D perturbation by cyclosporine A and its mitochondrial targeted analogue. Reliable intermediate state averaging through a WHAM analysis of the biased dynamic pulling simulations confirmed that the cardio‐protective activity of cyclosporine A was due to its mitochondrial targeting. Paralleltempered solution molecular dynamics in combination with efficient clustering isolated the essential dynamics of a cyclic peptide scaffold. The rapid enumeration of skeletons from these essential dynamics gave rise to a conformation laden virtual library of all the 15.2 Billion unique cyclic peptides (given the limits on peptide sequence imposed). Analysis of this library showed the exact extent of physicochemical properties covered, relative to the bare scaffold precursor. Molecular docking of a subset of the virtual library against cyclophilin‐D showed significant improvements in affinity to the target (relative to cyclosporine A). The conformation laden virtual library, accessed by our methodology, provided derivatives that were able to make many interactions per peptide with the cyclophilin‐D target. Machine learning methods showed promise in the training of Support Vector Machines for synthetic feasibility prediction for this library. The synergy between enumeration and conformational sampling greatly improves the performance of this library during virtual screening, even when only a subset is used

    Sobiva omaduste profiiliga ühendite tuvastamine keemiliste struktuuride andmekogudest

    Get PDF
    Keemiliste ühendite digitaalsete andmebaaside kasutuselevõtuga kaasneb vajadus leida neist arvutuslikke vahendeid kasutades sobivate omadustega molekule. Probleem on eriti huvipakkuv ravimitööstuses, kus aja- ja ressursimahukate katsete asendamine arvutustega, võimaldab märkimisväärset säästu. Kuigi tänapäevaste arvutusmeetodite piiratud võimsuse tõttu ei ole lähemas tulevikus võimalik kogu ravimidisaini protsessi algusest lõpuni arvutitesse ümber kolida, on lugu teine, kui vaadelda suuri andmekogusid. Arvutusmeetod, mis töötab teadaoleva statistilise vea piires, visates välja mõne sobiva ühendi ja lugedes mõni ekslikult aktiivseks, tihendab lõppkokkuvõttes andmekomplekti tuntaval määral huvitavate ühendite suhtes. Seetõttu on ravimiarenduse lihtsamate ja vähenõudlikkumade etappide puhul, nagu juhtühendite või ravimikandidaatide leidmine, edukalt võimalik rakendada arvutuslikke vahendeid. Selline tegevus on tuntud virtuaalsõelumisena ning käesolevasse töösse on sellest avarast ja kiiresti arenevast valdkonnast valitud mõningad suunad, ning uuritud nende võimekust ja tulemuslikkust erinevate projektide raames. Töö tulemusena on valminud arvutusmudelid teatud tüüpi ühendite HIV proteaasi vastase aktiivsuse ja tsütotoksilisuse hindamiseks; koostatud uus sõelumismeetod; leitud potentsiaalsed ligandid HIV proteaasile ja pöördtranskriptaasile; ning kokku pandud farmakokineetiliste filtritega eeltöödeldud andmekomplekt – mugav lähtepositsioon edasisteks töödeks.With the implementation of digital chemical compound libraries, creates the need for finding compounds from them that fit the desired profile. The problem is of particular interest in drug design, where replacing the resource-intensive experiments with computational methods, would result in significant savings in time and cost. Although due to the limitations of current computational methods, it is not possible in foreseeable future to transfer all of the drug development process into computers, it is a different story with large molecular databases. An in silico method, working within a known error margin, is still capable of significantly concentrating the data set in terms of attractive compounds. That allows the use of computational methods in less stringent steps of drug development, such as finding lead compounds or drug candidates. This approach is known as virtual screening, and today it is a vast and prospective research area comprising of several paradigms and numerous individual methods. The present thesis takes a closer look on some of them, and evaluates their performance in the course of several projects. The results of the thesis include computational models to estimate the HIV protease inhibition activity and cytotoxicity of certain type of compounds; a few prospective ligands for HIV protease and reverse transcriptase; pre-filtered dataset of compounds – convenient starting point for subsequent projects; and finally a new virtual screening method was developed

    Molecular simulations on proteins of biomedical interest : A. Ligand-protein hydration B. Cytochrome P450 2D6 and 2C9 C. Myelin associated glycoprotein (MAG)

    Get PDF
    TOPIC 1: Water molecules mediating polar interactions in ligand–protein complexes contribute to both binding affinity and specificity. To account for such water molecules in computer-aided drug discovery, we performed an extensive search in the Cambridge Structural Database (CSD) to identify the geometrical criteria defining interactions of water molecules with ligand and protein. In addition, ab initio calculations were used to derive the propensity of ligand hydration. Based on these information we developed an algorithm (AcquaAlta) to reproduce water molecules bridging polar interactions between ligand and protein moieties. This approach was validated using 20 crystal structures and yielded a match of 76% between experimental and calculated water positions. The solvation algorithm was then applied to the docking of oligopeptides to the periplasmic oligopeptide binding protein A (OppA), supported by a pharmacophore-based alignment tool. TOPIC 2: Drug metabolism, toxicity, and interaction profile are major issues in the drug discovery and lead optimization processes. The Cytochromes P450 (CYPs) 2D6 and 2C9 are enzymes involved in the oxidative metabolism of a majority of the marketed drugs. By identifying the binding mode using pharmacophore pre-alignement and automated flexible docking, and quantifying the binding affinity by multi-dimensional QSAR, we validated a model family of 56 compounds (46 training, 10 test) and 85 (68 training, 17 test) for CYP2D6 and CYP2C9, respectively. The correlation with the experimental data (cross- validated r2 = 0.811 for CYP2D6 and 0.687 for CYP2C9) suggests that our approach is suited for predicting the binding affinity of compounds towards the CYP2D6 and CYP2C9. The models were challenged by Y-scrambling, and by testing an external dataset of binding compounds (15 compounds for CYP2D6 and 40 for CYP2C9) and not binding compounds (64 compounds for CYP2D6 and 56 for CYP2C9). TOPIC 3: After injury, neurites from mammalian adult central nervous systems are inhibited to regenerate by inhibitory proteins such as the myelin-associated glycoprotein (MAG). The block of MAG with potent glycomimetic antagonists could be a fruitful approach to enhance axon regeneration. Libraries of MAG antagonists were derived and synthesized starting from the (general) sialic acid moiety. The binding data were rationalized by docking studies, molecular dynamics simulations and free energy perturbations on a homology model of MAG. The pharmacokinetic profile (i.e. stability in cerebrospinal fluid, logD, and blood-brain barrier permeation) of these compounds has been thoroughly investigated to evaluate the drug-likeness of the identified antagonists

    In silico studies of the effect of phenolic compounds from grape seed extracts on the activity of phosphoinositide 3-kinase (PI3K) and the farnesoid x receptor (FXR)

    Get PDF
    In silico studies of the effect of phenolic compounds from grape seed extracts on the activity of phosphoinositide 3-kinase (PI3K) and farnesoid X receptor (FXR)Montserrat Vaqué Marquès En aquesta tesis es pretén aplicar metodologies computacionals (generació de farmacòfors i docking proteïna lligand) en l'àmbit de la nutigenòmica (ciència que pretén entendre, a nivell molecular, com els nutrients afecten la salut). S'aplicaran metodologies in silico per entendre a nivell molecular com productes naturals com els compostos fenòlics presents en la nostra dieta, poden modular la funció d'una diana comportant un efect en la salut. Aquest efecte es creu que podria ser degut a la seva interacció directa amb proteïnes de vies de senyalització molecular o bé a la modificació indirecta de l'expressió gènica. Donat que el coneixement de l'estructura del complex lligand-receptor és bàsic per entendre el mecanisme d'acció d'aquests lligands s'aplica la metodologia docking per predir l'estructura tridimensional del complex. En aquest sentit, un dels programes de docking és AutoGrid/AutoDock (un dels més citats). No obstant, l'automatització d'AutoGrid/AutoDock no és trivial tan per (a) la cerca virtual en una llibreria de lligands contra un grup de possibles receptors, (b) l'ús de flexibilitat, i (c) realitzar un docking a cegues utilitzant tota la superfície del receptor. Per aquest motiu, es dissenya una interfície gràfica de fàcil ús per utilitzar AutoGrid/AutoDock. Blind Docking Tester (BDT) és una aplicació gràfica que s'executa sobre quatre programes escrits en Fortran i que controla les condicions de les execucions d'AutoGrid i AutoDock. BDT pot ser utilitzat per equips d'investigadors en el camp de la química i de ciències de la vida interessats en dur a terme aquest tipus d'experiments però que no tenen suficient habilitats en programació. En la modulació del metabolisme de la glucosa, treballs in vivio i in vitro en el nostre grup de recerca s'han atribuït els efectes beneficiosos de l'extracte de pinyol de raïm en induir captació de glucosa (punt crític pel manteniment de l'homeostasis de la glucosa). No obstant alguns compostos fenòlics no tenen efecte en la captació de la glucosa, d'altres l'inhibeixen reversiblement. En alguns casos aquesta inhibició és el resultat de la competició dels compostos fenòlics amb ATP pel lloc d'unió de l'ATP de la subunitat catalítica de la fosfatidil inositol 3-kinasa (PI3K). Estudis recents amb inhibidors específics d'isoforma han identificat la p110α (la subunitat catalítica de PI3Kα) com la isoforma crucial per la captació de glucosa estimulada per insulina en algunes línies cel·lulars. Els programes computacionals han estat aplicats per tal de correlacionar l'activitat biològica dels compostos fenòlics amb informació estructural per obtenir una relació quantitativa estructura-activitat (3D-QSAR) i obtenir informació dels requeriments estructura-lligand per augmentar l'afinitat i/o selectivitat amb la diana (proteïna). Tot hi haver-se demostrat que l'adició d'extractes de compostos fenòlics en l'aliment pot tenir en general un benefici per la salut, s'ha de tenir en compte que l'estudi 3D-QSAR (construït a partir d'inhibidors sintètics de p110α) prediu que algunes d'aquestes molècules poden agreujar la resistència a la insulina en individus susceptibles dificultant la capatació de glucosa en múscul i teixit adipós i, per tant, produir un efecte secundari indesitjat. Resultats en el nostre grup de recerca han demostrat que compostos fenòlics presents en extractes de llavor de raïm incrementen l'activitat del receptor "farnesoid x receptor" (FXR) de manera dosi depenent quan el lligand natural de FXR (CDCA) és present. Les metodologies in silico, docking i 3D-QSAR, han estat aplicades juntament amb dades biològiques d'agonistes no esteroidals de FXR que s'uneixen a un lloc d'unió proper però diferent al lligand esteroidal 6CDCA. Els resultats han mostrat que els compostos fenòlics no són capaços d'activar FXR per ells mateixos però poden afegir noves interaccions que estabilitzarien la conformació activa de FXR en presència del lligand natural CDCA. Els compostos fenòlics podrien induir canvis conformacionals específics que augmentarien l'activitat de FXR. In silico studies of the effect of phenolic compounds from grape seed extracts on the activity of phosphoinositide 3-kinase (PI3K) and farnesoid X receptor (FXR)Montserrat Vaqué Marquès This thesis was written with the aim of applying computational methods that have already been developed for molecular design and simulation (i.e. pharmacophore generation and protein-ligand docking) to nutrigenomics. So, in silico tools that are routinely used by the pharmaceutical industry to develop drugs have been used to understand, at the molecular level, how natural products such as phenolic compounds (i.e. molecules that are commonly found in fruits and vegetables) can improve health and prevent diseases. Therefore, we first focused on predicting the structure of protein-ligand complexes. The docking algorithms can use the individual structures from receptor and ligand to predict (1) whether they can form a complex and (2) if so, the structure of the resulting complex. This prediction can be made, for instance, with AutoGrid/AutoDock, the most cited docking software in the literature. The automation of AutoGrid/AutoDock is not trivial for tasks such as (1) the virtual screening of a library of ligands against a set of possible receptors; (2) the use of receptor flexibility and (3) making a blind-docking experiment with the whole receptor surface. Therefore, in order to circumvent these limitations, we have designed BDT (i.e. blind-docking tester; http://www.quimica.urv.cat/~pujadas/BDT), an easy-to-use graphic interface for using AutoGrid/AutoDock. BDT is a Tcl/Tk graphic front-end application that runs on top of four Fortran programs and which controls the conditions of the AutoGrid and AutoDock runs. As far as the modulation of the glucose metabolism is concerned, several in vivo and in vitro results obtained by our group have shown that grape seed procyanidin extracts (GSPE) stimulate glucose uptake in 3T3-L1 adipocytes and thus help to maintain their glucose homeostasis. In contrast, it is also well known that although some phenolic compounds do not affect glucose uptake, others reversibly inhibit it in several cell lines. Moreover, for at least some of these phenolic compounds, this inhibition is the result of their competition with ATP for the ATP-binding site in p110α (i.e. the α isoform of the catalytic subunit of phosphoinositide 3-kinase or PI3Kα). Furthermore, recent studies with isoform-specific inhibitors have identified p110α as the crucial isoform for insulin-stimulated glucose-uptake in some cell lines. Therefore, although it has been proved that the addition of phenolic compound extracts to food can have an overall benefit on health, it should be taken into account that some of these molecules may exacerbate insulin resistance in susceptible individuals via impaired glucose uptake in muscle and adipose tissues and, therefore, produce an undesirable side effect. In this context, we have applied computational approaches (i.e. protein-ligand docking and 3D-QSAR) to predict the IC50 (i.e. the concentration that reduces the p110α activity to 50%). Our results agree with previous experimental results and predict that some compounds are potential inhibitors of this enzyme. Recent results in our research group have demonstrated that the phenolic compounds in GSPE increase the activity of the farnesoid X receptor (i.e. FXR) in a dose-dependent way when the natural ligand of FXR (i.e. CDCA) is also present. The phenolic compounds might induce specific conformational changes that increase FXR activity and then contribute to cardioprotection through mechanisms that are independent of their intrinsic antioxidant capacities but that involve direct interaction with FXR to modulate gene expression. Taking into account this hypothesis a 3D-QSAR analysis was made in an attempt to understand how phenolic compounds activate FXR. So, our results explain why phenolic compounds cannot activate FXR by themselves and how they can add new interactions to stabilize the active conformation of FXR when its natural ligand (i.e. CDCA) is present. Therefore, we proposed a mechanism of FXR activation by dietary phenolic compounds in which they may enhance bile acid-bound FXR activity

    Virtual screening of potential bioactive substances using the support vector machine approach

    Get PDF
    Die vorliegende Dissertation stellt eine kumulative Arbeit dar, die in insgesamt acht wissenschaftlichen Publikationen (fünf publiziert, zwei eingerichtet und eine in Vorbereitung) dargelegt ist. In diesem Forschungsprojekt wurden Anwendungen von maschinellem Lernen für das virtuelle Screening von Moleküldatenbanken durchgeführt. Das Ziel war primär die Einführung und Überprüfung des Support-Vector-Machine (SVM) Ansatzes für das virtuelle Screening nach potentiellen Wirkstoffkandidaten. In der Einleitung der Arbeit ist die Rolle des virtuellen Screenings im Wirkstoffdesign beschrieben. Methoden des virtuellen Screenings können fast in jedem Bereich der gesamten pharmazeutischen Forschung angewendet werden. Maschinelles Lernen kann einen Einsatz finden von der Auswahl der ersten Moleküle, der Optimierung der Leitstrukturen bis hin zur Vorhersage von ADMET (Absorption, Distribution, Metabolism, Toxicity) Eigenschaften. In Abschnitt 4.2 werden möglichen Verfahren dargestellt, die zur Beschreibung von chemischen Strukturen eingesetzt werden können, um diese Strukturen in ein Format zu bringen (Deskriptoren), das man als Eingabe für maschinelle Lernverfahren wie Neuronale Netze oder SVM nutzen kann. Der Fokus ist dabei auf diejenigen Verfahren gerichtet, die in der vorliegenden Arbeit verwendet wurden. Die meisten Methoden berechnen Deskriptoren, die nur auf der zweidimensionalen (2D) Struktur basieren. Standard-Beispiele hierfür sind physikochemische Eigenschaften, Atom- und Bindungsanzahl etc. (Abschnitt 4.2.1). CATS Deskriptoren, ein topologisches Pharmakophorkonzept, sind ebenfalls 2D-basiert (Abschnitt 4.2.2). Ein anderer Typ von Deskriptoren beschreibt Eigenschaften, die aus einem dreidimensionalen (3D) Molekülmodell abgeleitet werden. Der Erfolg dieser Beschreibung hangt sehr stark davon ab, wie repräsentativ die 3D-Konformation ist, die für die Berechnung des Deskriptors angewendet wurde. Eine weitere Beschreibung, die wir in unserer Arbeit eingesetzt haben, waren Fingerprints. In unserem Fall waren die verwendeten Fingerprints ungeeignet zum Trainieren von Neuronale Netzen, da der Fingerprintvektor zu viele Dimensionen (~ 10 hoch 5) hatte. Im Gegensatz dazu hat das Training von SVM mit Fingerprints funktioniert. SVM hat den Vorteil im Vergleich zu anderen Methoden, dass sie in sehr hochdimensionalen Räumen gut klassifizieren kann. Dieser Zusammenhang zwischen SVM und Fingerprints war eine Neuheit, und wurde von uns erstmalig in die Chemieinformatik eingeführt. In Abschnitt 4.3 fokussiere ich mich auf die SVM-Methode. Für fast alle Klassifikationsaufgaben in dieser Arbeit wurde der SVM-Ansatz verwendet. Ein Schwerpunkt der Dissertation lag auf der SVM-Methode. Wegen Platzbeschränkungen wurde in den beigefügten Veröffentlichungen auf eine detaillierte Beschreibung der SVM verzichtet. Aus diesem Grund wird in Abschnitt 4.3 eine vollständige Einführung in SVM gegeben. Darin enthalten ist eine vollständige Diskussion der SVM Theorie: optimale Hyperfläche, Soft-Margin-Hyperfläche, quadratische Programmierung als Technik, um diese optimale Hyperfläche zu finden. Abschnitt 4.3 enthält auch eine Diskussion von Kernel-Funktionen, welche die genaue Form der optimalen Hyperfläche bestimmen. In Abschnitt 4.4 ist eine Einleitung in verschiede Methoden gegeben, die wir für die Auswahl von Deskriptoren genutzt haben. In diesem Abschnitt wird der Unterschied zwischen einer „Filter“- und der „Wrapper“-basierten Auswahl von Deskriptoren herausgearbeitet. In Veröffentlichung 3 (Abschnitt 7.3) haben wir die Vorteile und Nachteile von Filter- und Wrapper-basierten Methoden im virtuellen Screening vergleichend dargestellt. Abschnitt 7 besteht aus den Publikationen, die unsere Forschungsergebnisse enthalten. Unsere erste Publikation (Veröffentlichung 1) war ein Übersichtsartikel (Abschnitt 7.1). In diesem Artikel haben wir einen Gesamtüberblick der Anwendungen von SVM in der Bio- und Chemieinformatik gegeben. Wir diskutieren Anwendungen von SVM für die Gen-Chip-Analyse, die DNASequenzanalyse und die Vorhersage von Proteinstrukturen und Proteininteraktionen. Wir haben auch Beispiele beschrieben, wo SVM für die Vorhersage der Lokalisation von Proteinen in der Zelle genutzt wurden. Es wird dabei deutlich, dass SVM im Bereich des virtuellen Screenings noch nicht verbreitet war. Um den Einsatz von SVM als Hauptmethode unserer Forschung zu begründen, haben wir in unserer nächsten Publikation (Veröffentlichung 2) (Abschnitt 7.2) einen detaillierten Vergleich zwischen SVM und verschiedenen neuronalen Netzen, die sich als eine Standardmethode im virtuellen Screening etabliert haben, durchgeführt. Verglichen wurde die Trennung von wirstoffartigen und nicht-wirkstoffartigen Molekülen („Druglikeness“-Vorhersage). Die SVM konnte 82% aller Moleküle richtig klassifizieren. Die Klassifizierung war zudem robuster als mit dreilagigen feedforward-ANN bei der Verwendung verschiedener Anzahlen an Hidden-Neuronen. In diesem Projekt haben wir verschiedene Deskriptoren zur Beschreibung der Moleküle berechnet: Ghose-Crippen Fragmentdeskriptoren [86], physikochemische Eigenschaften [9] und topologische Pharmacophore (CATS) [10]. Die Entwicklung von weiteren Verfahren, die auf dem SVM-Konzept aufbauen, haben wir in den Publikationen in den Abschnitten 7.3 und 7.8 beschrieben. Veröffentlichung 3 stellt die Entwicklung einer neuen SVM-basierten Methode zur Auswahl von relevanten Deskriptoren für eine bestimmte Aktivität dar. Eingesetzt wurden die gleichen Deskriptoren wie in dem oben beschriebenen Projekt. Als charakteristische Molekülgruppen haben wir verschiedene Untermengen der COBRA Datenbank ausgewählt: 195 Thrombin Inhibitoren, 226 Kinase Inhibitoren und 227 Faktor Xa Inhibitoren. Es ist uns gelungen, die Anzahl der Deskriptoren von ursprünglich 407 auf ungefähr 50 zu verringern ohne signifikant an Klassifizierungsgenauigkeit zu verlieren. Unsere Methode haben wir mit einer Standardmethode für diese Anwendung verglichen, der Kolmogorov-Smirnov Statistik. Die SVM-basierte Methode erwies sich hierbei in jedem betrachteten Fall als besser als die Vergleichsmethoden hinsichtlich der Vorhersagegenauigkeit bei der gleichen Anzahl an Deskriptoren. Eine ausführliche Beschreibung ist in Abschnitt 4.4 gegeben. Dort sind auch verschiedene „Wrapper“ für die Deskriptoren-Auswahl beschrieben. Veröffentlichung 8 beschreibt die Anwendung von aktivem Lernen mit SVM. Die Idee des aktiven Lernens liegt in der Auswahl von Molekülen für das Lernverfahren aus dem Bereich an der Grenze der verschiedenen zu unterscheidenden Molekülklassen. Auf diese Weise kann die lokale Klassifikation verbessert werden. Die folgenden Gruppen von Moleküle wurden genutzt: ACE (Angiotensin converting enzyme), COX2 (Cyclooxygenase 2), CRF (Corticotropin releasing factor) Antagonisten, DPP (Dipeptidylpeptidase) IV, HIV (Human immunodeficiency virus) protease, Nuclear Receptors, NK (Neurokinin receptors), PPAR (peroxisome proliferator-activated receptor), Thrombin, GPCR und Matrix Metalloproteinasen. Aktives Lernen konnte die Leistungsfähigkeit des virtuellen Screenings verbessern, wie sich in dieser retrospektiven Studie zeigte. Es bleibt abzuwarten, ob sich das Verfahren durchsetzen wird, denn trotzt des Gewinns an Vorhersagegenauigkeit ist es aufgrund des mehrfachen SVMTrainings aufwändig. Die Publikationen aus den Abschnitten 7.5, 7.6 und 7.7 (Veröffentlichungen 5-7) zeigen praktische Anwendungen unserer SVM-Methoden im Wirkstoffdesign in Kombination mit anderen Verfahren, wie der Ähnlichkeitssuche und neuronalen Netzen zur Eigenschaftsvorhersage. In zwei Fällen haben wir mit dem Verfahren neuartige Liganden für COX-2 (cyclooxygenase 2) und dopamine D3/D2 Rezeptoren gefunden. Wir konnten somit klar zeigen, dass SVM-Methoden für das virtuelle Screening von Substanzdatensammlungen sinnvoll eingesetzt werden können. Es wurde im Rahmen der Arbeit auch ein schnelles Verfahren zur Erzeugung großer kombinatorischer Molekülbibliotheken entwickelt, welches auf der SMILES Notation aufbaut. Im frühen Stadium des Wirstoffdesigns ist es wichtig, eine möglichst „diverse“ Gruppe von Molekülen zu testen. Es gibt verschiedene etablierte Methoden, die eine solche Untermenge auswählen können. Wir haben eine neue Methode entwickelt, die genauer als die bekannte MaxMin-Methode sein sollte. Als erster Schritt wurde die „Probability Density Estimation“ (PDE) für die verfügbaren Moleküle berechnet. [78] Dafür haben wir jedes Molekül mit Deskriptoren beschrieben und die PDE im N-dimensionalen Deskriptorraum berechnet. Die Moleküle wurde mit dem Metropolis Algorithmus ausgewählt. [87] Die Idee liegt darin, wenige Moleküle aus den Bereichen mit hoher Dichte auszuwählen und mehr Moleküle aus den Bereichen mit niedriger Dichte. Die erhaltenen Ergebnisse wiesen jedoch auf zwei Nachteile hin. Erstens wurden Moleküle mit unrealistischen Deskriptorwerten ausgewählt und zweitens war unser Algorithmus zu langsam. Dieser Aspekt der Arbeit wurde daher nicht weiter verfolgt. In Veröffentlichung 6 (Abschnitt 7.6) haben wir in Zusammenarbeit mit der Molecular-Modeling Gruppe von Aventis-Pharma Deutschland (Frankfurt) einen SVM-basierten ADME Filter zur Früherkennung von CYP 2C9 Liganden entwickelt. Dieser nichtlineare SVM-Filter erreichte eine signifikant höhere Vorhersagegenauigkeit (q2 = 0.48) als ein auf den gleichen Daten entwickelten PLS-Modell (q2 = 0.34). Es wurden hierbei Dreipunkt-Pharmakophordeskriptoren eingesetzt, die auf einem dreidimensionalen Molekülmodell aufbauen. Eines der wichtigen Probleme im computerbasierten Wirkstoffdesign ist die Auswahl einer geeigneten Konformation für ein Molekül. Wir haben versucht, SVM auf dieses Problem anzuwenden. Der Trainingdatensatz wurde dazu mit jeweils mehreren Konformationen pro Molekül angereichert und ein SVM Modell gerechnet. Es wurden anschließend die Konformationen mit den am schlechtesten vorhergesagten IC50 Wert aussortiert. Die verbliebenen gemäß dem SVM-Modell bevorzugten Konformationen waren jedoch unrealistisch. Dieses Ergebnis zeigt Grenzen des SVM-Ansatzes auf. Wir glauben jedoch, dass weitere Forschung auf diesem Gebiet zu besseren Ergebnissen führen kann
    corecore