2 research outputs found

    On-Demand Big Data Integration: A Hybrid ETL Approach for Reproducible Scientific Research

    Full text link
    Scientific research requires access, analysis, and sharing of data that is distributed across various heterogeneous data sources at the scale of the Internet. An eager ETL process constructs an integrated data repository as its first step, integrating and loading data in its entirety from the data sources. The bootstrapping of this process is not efficient for scientific research that requires access to data from very large and typically numerous distributed data sources. a lazy ETL process loads only the metadata, but still eagerly. Lazy ETL is faster in bootstrapping. However, queries on the integrated data repository of eager ETL perform faster, due to the availability of the entire data beforehand. In this paper, we propose a novel ETL approach for scientific data integration, as a hybrid of eager and lazy ETL approaches, and applied both to data as well as metadata. This way, Hybrid ETL supports incremental integration and loading of metadata and data from the data sources. We incorporate a human-in-the-loop approach, to enhance the hybrid ETL, with selective data integration driven by the user queries and sharing of integrated data between users. We implement our hybrid ETL approach in a prototype platform, Obidos, and evaluate it in the context of data sharing for medical research. Obidos outperforms both the eager ETL and lazy ETL approaches, for scientific research data integration and sharing, through its selective loading of data and metadata, while storing the integrated data in a scalable integrated data repository.Comment: Pre-print Submitted to the DMAH Special Issue of the Springer DAPD Journa

    Structure based studies on the neurotransmitter

    Get PDF
    Der Serotonin Transporter ist ein neuronales Membranprotein, zuständig für die Wiederaufnahme von während eines Aktionspotentiales in den synaptischen Spalt freigesetztem Serotonin. Dieser ist gemeinsam mit dem Dopamin Transporter und dem Noradrenalin Transporter zugehörig zur Familie des SLC6 Gens, bzw. der Familie der neuronalen Monoamin oder Neurotransmitter:Natrium Transporter. Diese integralen Membranproteine nutzen einen existierenden Natriumgradienten als Energiequelle für den Transport der Neurotransmitter Serotonin, Dopamin und Noradrenalin gegen den Konzentrationsgradienten in die freisetzende Nervenzelle. Sie spielen eine entscheidende Rolle in der Homöostase dieser wichtigen Transmitter und sind aus diesem Grund in verschiedene Erkrankungen des Nervensystems involviert, wie zum Beispiel der Depression. Die Neurotransmittertransporter sind wichtige Angriffspunkte der Pharmakotherapie dieser Krankheit. Auch illegale Drogen, wie Kokain oder Amphetamine, zeigen ihre Wirkungen durch die Beeinflussung der Wiederaufnahme der genannten Neurotransmitter[1]. Bis zum Zeitpunkt, wurde noch keiner der humanen Transporter kristallisiert. Die Kirstallstruktur eines bakteriellen Leucinransporters, homolog in Struktur und Funktion zu den Neurotransmittertransportern, konnte bisher in drei unterschiedlichen Konformationen aufgeklärt werden[2, 9, 10]. Die Sequenzidentität zwischen dem Leucin- und dem Serotonin beträgt ungefähr 20 % über die gesamte Sequenz und 45 % in der Bindungstasche[3]. Die genauen molekularen Mechanismen der Transporterhemmung und des Substrattransports sind Gegenstand intensiver Forschungen. Um detailierte Einsichten in die molekularen Protein–Ligand–Interaktionen zwischen trizyklischen Antidepressiva und dem Serotonintransporter zu erhalten, wurden in der vorliegenden Studie rechnergestützte Methoden mit pharmakologischen Experimenten kombiniert. Diese wurde im Rahmen des Spezialforschungsbereichs 35 (SFB35 — Transmembranäre Transporter in Gesundheit und Krankheit) in Kooperation mit Prof. Michael Freissmuth, Leiter des Instituts für Pharmakologie der Medizinischen Universität Wien, und Prof. Harald Sitte, Sprecher des Forschungsprojekts SFB35, durchgeführt. Zunächst wurde ein Homologiemodell[4] des Serotonintransporters basierend auf den strukturellen Daten des Leucintransporters in der zum Extrazellularraum offenen Konformation[2] sowie den angeglichen Primärsequenzen[3] erstellt. Dieses Modell war die Grundlage für die computerunterstützten Bindungsstudien (docking)[5] ausgewählter tricyclischer Antidepressiva. Um eine Verzerrung der ersten Ergebnisse durch Bewertungsfunktionen (scoring) zu vermeiden, wurde ein Protokoll erarbeitet, das die Informationen aus den Protein–Ligand–Interaktionen der erhaltenen Komplexe einerseits und publizierten Daten andererseits mit den geometrischen Informationen der Atomkoordinaten, die über hierarchisch–agglomeratives Gruppieren (clustering) reduziert wurden, kombiniert. Das Auswahlverfahren der durch die Bindungsstudien erhaltenen Komplexe wurde letztendlich durch die Ergebnisse der experimentellen Daten unterstützt. Diese Zusammenarbeit konnte einen neuen Bindungsmodus von Imipramin im Serotonintransporter zeigen[6]. Um diese Bindungshypothese zu stützen, aber auch diese zu verifizieren wurden weitere Methoden angewendet. Parallel zu den Punktmutationen am Serotonintransporter wurden Moleküldynamiksimulationen[7] an den ausgewählten Protein–Ligand–Komplexen durchgeführt, um die molekularen Mechanismen zu studieren. Diese sehr rechenintensiven Simulationen wurden am Wiener Wissenschafts Großrechner (Vienna Scientific Cluster — VSC, www.vsc.ac.at) durchgeführt. Die daraufhin erhaltenen Daten sind bezüglich Stabilität des Liganden, spezifischen Distanzen und Wasserstoffbrücken und deren Neztwerken untersucht worden. Die Auswertung erfolgte halbautomatisch durch die Erstellung von kleinen Programmen (scripts). Es konnte gezeigt werden, dass es während der Bindung von Inhibitoren am Serotonintransporter zu Interaktionen mit Wassermolekülen kommen kann. Diese Informationen flossen neben den Informationen der getesteten Wirkstoffe und des erhaltenen Komplexes von Imipramin im Serotonintransporter in den letzten Teil der Studie ein: dem Pharmakophormodell[8]. Dieses Modell diente als Grundlage für das elektronische Sichten (screening) einer Datenbank mit zu Arzneistoffen ähnlicher und verfügbarer Substanzen. Aus dieser Datenbank wurden 13 Substanzen ausgewählt und zum Zweck der experimentellen Überprüfung erworben (www.lifechemicals.com). Am Institut für Pharmakologie wurden die Substanzen pharmakologisch am Serotonintransporter getestet. 4 der 13 Substanzen zeigten eine Wirkung im nieder μ-molaren Bereich, was auf potenziell neue, am Serotonintransporter wirksame Substanzen hindeutet. Bibliography [1] A. S. Kristensen, J. Andersen, T. N. Jørgensen, L. Sørensen, J. Eriksen, C. J. Løland, K. Strømgaard, U. Gether, Pharmacol Rev 2011, 63, 585–640. [2] S. K. Singh, C. L. Piscitelli, A. Yamashita, E. Gouaux, Science 2008, 322, 1655–1661. [3] T. Beuming, L. Shi, J. A. Javitch, H. Weinstein, Mol Pharmacol 2006, 70, 1630–1642. [4] A. Sali, T. L. Blundell, J Mol Biol 1993, 234, 779–815. [5] Chemical Computing Group, MOE: Molecular Operating Environment, 2009. http://www.chemcomp.com. [6] S. Sarker, R. Weissensteiner, I. Steiner, H. H. Sitte, G. F. Ecker, M. Freissmuth, S. Sucic, Mol Pharmacol 2010, 78, 1026–1035. [7] B. Hess, C. Kutzner, D. van der Spoel, E. Lindahl, Journal of Chemical Theory and Computation 2008, 4, 435–447. [8] G. Wolber, T. Langer, J Chem Inf Model 2005, 45, 160–169.The serotonin transporter (SERT), among the transporters for dopamine (DAT) and norepinephrine (NET) member of the SLC6 gene family, is an integrated membrane protein facilitating the rapid reuptake of previously released serotonin from the synaptic cleft and thus the main mechanism of terminating the neurochemical signal using an electrochemical sodium gradient. Involved in various diseases of the central nervous system, such as depression, it is with NET the main target for antidepressant therapy and together with DAT targeted by psychostimulants[1]. Up to now, no crystal structure of a human neurotransmitter:sodium symporter (NSS) is available. High resolution crystal structures of a bacterial homologue leucine transporter (LeuT) were resolved[2]. Similar in structure and function, it shares a sequence identity of ∼45% with the NSS in the binding site[3]. The detailed molecular mechanisms of binding and inhibition of the transporters is still a matter of discussion. To get insights into the molecular mechanisms of protein ligand interactions, in-vitro and in-silico methods are combined to answer questions about interactions of tricyclic antidepressants (TCA) with SERT at atomic level within the framework of the research project SFB35 (Spezialforschungsbereich 35, www.sfb35.at). Starting with homology modelling[4] of the human transporters based on the ‘open-to-out’ conformation of the template LeuT, subsequent docking experiments[5] with selected inhibitors have been performed. A protocol was elaborated to avoid bias from scoring functions in an early step, that uses primarily hierarchical clustering and protein–ligand–interactions combined with experimental data. The selection of the docking solutions was finally driven by the results of the pharmacological assays and ended up in a newly proposed binding mode for imipramine in SERT[6]. To further assess the docking complexes in explicit water, molecular dynamics simulations[7] were performed on the finally selected docking poses. In total, ≈ 60 simulations were carried out on the Vienna Scientific Cluster (www.vsc.ac.at). The trajectories were analysed with respect to the stability of the ligand, specific protein-ligand distances and hydrogen bond networks. As final part, pharmacophore modelling[8] and virtual screening was applied. A database of 300000 purchasable drug–like compounds (www.lifechemicals.com) was used for screening against the validated model. The finally selected compounds have been experimentally tested at the Institute of Pharmacology, Medical University of Vienna. The experiments revealed active compounds with a binding affinity in low μM range. Bibliography [1] A. S. Kristensen, J. Andersen, T. N. Jørgensen, L. Sørensen, J. Eriksen, C. J. Løland, K. Strømgaard, U. Gether, Pharmacol Rev 2011, 63, 585–640. [2] S. K. Singh, C. L. Piscitelli, A. Yamashita, E. Gouaux, Science 2008, 322, 1655–1661. [3] T. Beuming, L. Shi, J. A. Javitch, H. Weinstein, Mol Pharmacol 2006, 70, 1630–1642. [4] A. Sali, T. L. Blundell, J Mol Biol 1993, 234, 779–815. [5] Chemical Computing Group, MOE: Molecular Operating Environment, 2009. http://www.chemcomp.com. [6] S. Sarker, R. Weissensteiner, I. Steiner, H. H. Sitte, G. F. Ecker, M. Freissmuth, S. Sucic, Mol Pharmacol 2010, 78, 1026–1035. [7] B. Hess, C. Kutzner, D. van der Spoel, E. Lindahl, Journal of Chemical Theory and Computation 2008, 4, 435–447. [8] G. Wolber, T. Langer, J Chem Inf Model 2005, 45, 160–169
    corecore