589 research outputs found

    Poly(A) Tail Regulation in the Nucleus

    Get PDF
    Der Ribonukleinsäure (RNS) Stoffwechsel umfasst verschiedene Schritte, beginnend mit der Transkription der RNS über die Translation bis zum RNA Abbau. Poly(A) Schwänze befinden sich am Ende der meisten der Boten-RNS, schützen die RNA vor Abbau und stimulieren Translation. Die Deadenylierung von Poly(A) Schwänzen limitiert den Abbau von RNS. Bisher wurde RNS Abbau meist im Kontext von cytoplasmatischen Prozessen untersucht, ob und wie RNS Deadenylierung und Abbau in Nukleus erfolgen ist bisher unklar. Es wurde daher eine neue Methode zur genomweiten Bestimmung von Poly(A) Schwanzlänge entwickelt, welche FLAM-Seq genannt wurde. FLAM-Seq wurde verwendet um Zelllinien, Organoide und C. elegans RNS zu analysieren und es wurde eine signifikante Korrelation zwischen 3’-UTR und Poly(A) Länge gefunden, sowie für viele Gene ein Zusammenhang von alternativen 3‘-UTR Isoformen und Poly(A) Länge. Die Untersuchung von Poly(A) Schwänzen von nicht-gespleißten RNS Molekülen zeige, dass deren Poly(A) Schwänze eine Länge von mehr als 200 nt hatten. Die Analyse wurde durch eine Inhibition des Spleiß-Prozesses validiert. Die Verwendung von Methoden zur Markierung von RNS, welche die zeitliche Auflösung der RNS Prozessierung ermöglicht, deutete auf eine Deadenylierung der Poly(A) Schwänze schon wenige Minuten nach deren Synthesis hin. Die Analyse von subzellulären Fraktionen zeigte, dass diese initiale Deadenylierung ein Prozess im Nukleus ist. Dieser Prozess ist gen-spezifisch und Poly(A) Schwänze von bestimmten Typen von Transkripten, wie nuklearen langen nicht-kodierende RNS Molekülen waren nicht deadenyliert. Um Enzyme zu identifizieren, welche die Deadenylierung im Zellkern katalysieren, wurden verschiedene Methoden wie RNS-abbauende Cas Systeme, siRNAs oder shRNA Zelllinien verwendet. Trotz einer effizienten Reduktion der RNS Expression entsprechender Enzymkomplexe konnten keine molekularen Phänotypen identifiziert werden welche die Poly(A) Länge im Zellkern beeinflussen.The RNA metabolism involves different steps from transcription to translation and decay of messenger RNAs (mRNAs). Most mRNAs have a poly(A) tail attached to their 3’-end, which protects them from degradation and stimulates translation. Removal of the poly(A) tail is the rate-limiting step in RNA decay controlling stability and translation. It is yet unclear if and to what extent RNA deadenylation occurs in the mammalian nucleus. A novel method for genome-wide determination of poly(A) tail length, termed FLAM-Seq, was developed to overcome current challenges in sequencing mRNAs, enabling genome-wide analysis of complete RNAs, including their poly(A) tail sequence. FLAM-Seq analysis of different model systems uncovered a strong correlation between poly(A) tail and 3’-UTR length or alternative polyadenylation. Cytosine nucleotides were further significantly enriched in poly(A) tails. Analyzing poly(A) tails of unspliced RNAs from FLAM-Seq data revealed the genome-wide synthesis of poly(A) tails with a length of more than 200 nt. This could be validated by splicing inhibition experiments which uncovered potential links between the completion of splicing and poly(A) tail shortening. Measuring RNA deadenylation kinetics using metabolic labeling experiments hinted at a rapid shortening of tails within minutes. The analysis of subcellular fractions obtained from HeLa cells and a mouse brain showed that initial deadenylation is a nuclear process. Nuclear deadenylation is gene specific and poly(A) tails of lncRNAs retained in the nucleus were not shortened. To identify enzymes responsible for nuclear deadenylation, RNA targeting Cas-systems, siRNAs and shRNA cell lines were used to different deadenylase complexes. Despite efficient mRNA knockdown, subcellular analysis of poly(A) tail length by did not yield molecular phenotypes of changing nuclear poly(A) tail length

    Determination of protein localization and RNA kinetics in human cells

    Get PDF
    In dieser Dissertation haben wir das Verhalten menschlicher Zellen in Raum und Zeit untersucht. Hochwertige Datensätze subzellulärer Regionen in HEK293-Zellen wurden mit Hilfe der BirA* Proximity-Labelling-Aktivität erstellt, wobei die Lokalisierung auf zelluläre Regionen beschränkt wurde, die mit herkömmlichen Methoden nur schwer zu reinigen sind (d. h. die dem Zytosol zugewandten Seiten des ER, Mitochondrien und Plasma-membranen). Wir entwickelten daraufhin einen Ansatz zur Kartierung der Verteilung von Proteinen, die aktiv an RNA binden, und nannten ihn f-XRNAX. Wir stellten hintergrundkorrigierte Proteome für Zellkerne, Zytoplasma und Membranen von HEK293-Zellen her. Überraschenderweise wurden viele nicht-kanonische RBPs in der Membranfraktion identifiziert, und ihre Peptidprofile waren in Regionen mit hoher Dichte an intrinsisch ungeordneten Regionen angereichert, was auf eine möglicherweise schwache, durch diese nicht-strukturellen Motive vermittelte Interaktion mit RNA hinweist. Schließlich konnten wir die unterschiedliche Bindung desselben Proteins an RNA in verschiedenen HEK293-Kompartimenten nachweisen. Im zweiten Teil dieser Arbeit konzentrierten wir uns auf die Bestimmung und Quantifizierung von neu transkribierten RNAs auf Einzelzellebene. Die Kinetik der RNA-Transkription und -Degradation war bis vor kurzem auf Einzelzellebene nicht messbar. Daher haben wir einen neuen Ansatz (SLAM-Drop-seq genannt) entwickelt, indem wir die veröffentlichte SLAM-seq-Methode an Einzelzellen angepasst haben. Wir haben SLAM-Drop-seq verwendet, um die zeitabhängigen RNA-Kinetikraten der Transkription und des Umsatzes für Hunderte von oszillierenden Transkripten während des Zellzyklus von HEK293-Zellen zu schätzen. Wir fanden heraus, dass Gene ihre Expression mit unterschiedlichen Strategien regulieren und spezifische Modi zur Feinabstimmung ihrer kinetischen Raten entlang des Zellzyklus haben.In this PhD dissertation we investigated the behaviour of human cells through space and time. High quality datasets of subcellular regions in HEK293 cells were generated using BirA* proximity labelling activity and restricting its localization at cellular regions difficult to purified with traditional methods (i.e., the cytosol-facing sides of the endoplasmic reticulum, mitochondria, and plasma membranes). We then developed an approach to map the distribution of proteins actively binding to RNA, and named it f-XRNAX. We recovered background-corrected proteomes for nuclei, cytoplasm and membranes of HEK293 cells. Surprisingly, many non-canonical RBPs were identified in the membrane fraction, and their peptide profiles were enriched in regions with high density of intrinsically disordered regions, indicating a possibly weak interaction with RNA mediated by these non-structural motives. Lastly, we provided evidence of the differential binding to RNA of the same protein in different HEK293 compartments. In the second part of this thesis, we focused on the determination and quantification of newly transcribed RNAs at the single-cell level. The kinetics of RNA transcription, processing and degradation were until recently not measurable at the single-cell level. Thus, we have developed a novel approach (called SLAM-Drop-seq ) by adapting the published SLAM-seq method to single cells. We used SLAM Drop-seq to estimate time-dependent RNA kinetics rates of transcription and turnover for hundreds of oscillating transcripts during the cell cycle of HEK293 cells. We found that genes regulate their expression with different strategies and have specific modes to fine-tune their kinetic rates along the cell cycle

    Doctor of Philosophy

    Get PDF
    dissertationPost-transcriptional RNA modifications provide new structural and functional features to modified RNA molecules. Extensive research in the past has resulted in isolation of over 100 distinct nucleotide modifications from different organisms and in different RNA species. These modified nucleotides are distributed within the entire transcriptome comprising the cellular epitranscriptome. The ultimate goal of the research in the field is to address what the specific functions of specific modifications are, and also the impact of each on cellular physiology. However, the first question to be addressed is how these > 100 modified nucleotides are distributed within the transcriptome. RNA modification profiling using conventional techniques has provided a great body of knowledge about the distribution of many modifications in RNAs. However, these findings remained limited mostly to tRNAs and rRNAs, the two most abundant and also highly modified RNA species in different organisms. This is partly because of the lower sensitivity of applied classical technologies. Here in this dissertation, in Chapter 2, we are reporting an optimized new RNA bisulfite protocol suitable for high-throughput RNA cytosine methylation profiling. We present the results of application of this technique for 5-methyl-cytosine (m5C) profiling in mouse embryonic fibroblasts (MEFs) RNAs, isolated from wt and dnmt2-/- mice to explore the target specificity of DNA methyltransferase 2 (DNMT2) enzyme. In Chapter 3, we present a substantially novel technique: Aza-IP, for enrichment and identification of the direct targets of RNA cytosine methyltransferases (m5C-RMTs) as well as iv determination of the exact modified bases in the same experiment. We provide the results of the Aza-IP technique for two human m5C-RMTs; DNMT2 and NSUN2, representing their known and novel RNA targets/modified bases. In Chapter 4 we discuss how similar technologies to both of the RNA bisulfite sequencing and Aza-IP techniques as well as other methodologies can be applied and extended for transcriptome-wide profiling of RNA modifications other than m5C. In Chapter 5 we present the future directions of the work focused on cataloguing the direct targets of all human m5C-RMTs in human cultured cells in mouse and fish model systems, to elucidate the functions of cytosine methylation in RNA molecules

    RNA-based regulation of pluripotency and differentiation

    Get PDF
    RNA-bindende Proteine sind zentrale Regulatoren der Genexpression, aber ihre Funktionen bei der Koordinierung von Zellschicksalsentscheidungen sind unzureichend verstanden. In dieser Studie haben wir RNA interactome capture angewandt, um die globalen Dynamiken des RNA-gebundenen Proteoms während der Auflösung der Pluripotenz und neuronaler Differenzierung zu bestimmen. Wir haben entdeckt, dass 30-40% der RNA-bindenden Proteine sehr dynamisch während der Zellschicksalentscheidungen sind, die Abundanzdynamiken dieser Proteine aber nicht hauptursächlich dafür zu sein scheinen. Basierend auf unseren Daten haben wir ZAP (ZC3HAV1) als einen Faktor identifiziert, der mit Pluripotenz assoziiert ist. Um die Rolle von ZAP in der Stammzellbiologie zu analysieren, haben wir PAR-CLIP, SLAMseq und einen Differenzierungsassay angewandt. Unsere Daten haben gezeigt, dass ZAP mehr als 2,000 mRNA-Transkripte innerhalb des murinen Stammzelltranskriptoms in Abhängigkeit von CG-Dinukleotiden bindet. Zieltranskripte sind angereichert mit Genfunktionen in Zell-Zell-Interaktionen, Gewebemorphogenese und Pluripotenzregulation und werden in Abwesenheit von ZAP stabilisiert. Auβerdem haben wir herausgefunden, dass Depletion von ZAP zu flacherer und breiterer Koloniemorphologie von Stammzellen bei gleichzeitiger Fehlexpression von hunderten von Genen inklusive Lineage-Faktoren führt. Desweiteren führt Abwesenheit von ZAP zu erhöhter Geschwindigkeit bei der Auflösung der Pluripotenz. Zusammengefasst stellen wir die These auf, dass ZAP ein multi-modaler Regulator der Pluripotenz ist. ZAP agiert als positiver Regulator während Aufrechterhaltung der Pluripotenz, während es am Anfang der Pluripotenzauflösung pluripotenz-fördernde Faktoren herunterreguliert. Schlussendlich demonstriert diese Studie, wie die Erforschung von Dynamiken des RNA-gebundenen Proteoms während Zellschicksalsentscheidungen neue Wege öffnet, um die Funktion von RNA-bindenden Proteinen im entwicklungsbiologischen Kontext zu analysieren.RNA-binding proteins are key regulators of gene expression, but their functions in coordinating cell fate transitions are poorly understood. In this study, we applied RNA interactome capture to determine the global dynamics of the RNA-bound proteome during dissolution of pluripotency and neuronal differentiation. We discovered that 30-40% of RNA-binding proteins are highly dynamic during cell fate transitions and that these dynamics do not appear to be predominantly governed by alterations in their abundance. Based on our data, we identified ZAP (ZC3HAV1) as a factor highly associated with pluripotency. In order to dissect the role of ZAP in mESC biology, we applied a variety of approaches including PAR-CLIP, SLAMseq and pluripotency exit reporter assays. We found that ZAP binds more than 2,000 mRNAs in the mESC transcriptome in a CG dinucleotide-dependent manner. Targets are enriched for transcripts encoding cell-cell adhesion, tissue morphogenesis and pro-pluripotency regulators and stabilized in absence of ZAP. Furthermore, we found that ZAP depletion leads to flattened and spreading stem cell colony morphology, concomitant misexpression of hundreds of transcripts including lineage factors and accelerated early dissolution of pluripotency. In conclusion, we propose that ZAP is a multi-modal stem cell RNA-binding protein acting as a positive regulator in maintenance of pluripotency while aiding downregulation of pro-pluripotent factors at the onset of differentiation. Ultimately, this study demonstrates how exploration of RNA-bound proteome dynamics during cell fate transitions can open paths to dissecting functions of RNA-binding proteins in a developmental context

    Estimating the time-dependent RNA kinetic rates in the cell cycle

    Get PDF
    Die Menge an RNA in Eukaryonten wird durch ihre kinetischen Transkriptions-, Verarbeitungs- und Abbauraten bestimmt. Diese kinetischen Raten wurden bereits ausführlich in Zellpopulationen untersucht, allerdings unter der Annahme, dass diese in verschiedenen Zelltypen identisch sind. Die Genexpression ist jedoch während biologischer Prozesse wie z.B der Zellproliferation, Zelldifferenzierung und Zellteilung hochdynamisch. Die Untersuchung der RNA- Kinetikraten in Einzelzellen, die sich in verschiedenen Phasen desselben dynamischen Prozesses befinden, kann uns ein umfangreicheres Bild davon geben, wie RNA-Kinetikraten die Genexpression zeitabhängig koordinieren. In diesem Projekt, Wir haben die Methode der RNA- Stoffwechselmarkierung und der biochemischen Nukleosidkonversion mit der Einzelzell-RNA- Sequenzierung kombiniert. Wir leiteten ein zeitabhängiges kinetisches Geschwindigkeitsmodell ab und schätzten RNA-Transkriptions- und - Abbauraten über den zeitlichen Verlauf des Zellzyklus ab. Dabeiverwendeten wir Näherungen basierend auf der Lösung des resultierenden Differentialgleichungssystems. Wir fanden heraus, dass Transkriptions- und Abbauraten der meisten zyklischen Gene hochdynamisch sind. Unterschiedliche kinetische Regulationsmuster formen spezifische Genexpressionsprofile. Etwa 89 % der 377 von uns analysierten zyklischen Gene werden durch dynamische Transkriptions- und Abbauraten reguliert. Während der dynamischen Transkriptionsrate beobachteten wir auch, dass einige zyklische Gene durch dynamische Zerfallsraten angetrieben wurden. Unsere Studie bekräftigt die Bedeutung der zeitlichen Regulation von der Genexpression durch Produktion und Zerfall. Darüber hinaus hat die von uns entwickelte Methode das Potenzial, an verschiedene biologische Prozesse angepasst zu werden. Unser Ansatz in dieser Studie kann die Untersuchung der zeitlichen Genexpressionsregulation und der RNS- Kinetikraten voranbringen.RNA abundance in eukaryotes is determined by its kinetic rates of transcription, processing and degradation. Each of the kinetic rates has been extensively studied in bulk cell populations assuming they are equal in different cells. However, gene expression is highly dynamic during biological processes such as cell proliferation, cell differentiation, and cell division. Investigation of RNA kinetic rates in individual cells which are in different phases of the same dynamic process can give us a more comprehensive picture of how RNA kinetic rates coordinate gene expression in a time-dependent manner. In this project, we adapted the RNA metabolic labeling and biochemical nucleoside conversion method to droplet- based single-cell RNA sequencing. We derived a time- dependent kinetic rate model and estimated RNA transcription and degradation rates over the time course of the cell cycle using approximations based on the solution of the resulting system of differential equations. We found that transcription and degradation rates of most cycling genes are highly dynamic. Different kinetic regulation patterns shape specific gene expression profiles. Around 89% of the 377 cycling genes we analyzed are regulated by dynamic transcription and degradation rates. While dynamic transcription rate was prevalent, we also observed some cycling genes were driven by dynamic decay rates. Our study underscores the importance of temporal gene expression regulation by both production and decay. Moreover, the method we developed has the potential to be adapted to different biological processes. We suggest that our approach can advance the study of temporal gene expression regulation and RNA kinetic rates

    Characterizing Human Transfer RNAS by Hydro-TRNASEQ and PAR-CLIP

    Get PDF
    The participation of tRNAs in fundamental aspects of biology and disease necessitates an accurate, experimentally confirmed annotation of tRNA genes, and curation of precursor and mature tRNA sequences. This has been challenging, mainly because RNA secondary structure and nucleotide modifications, together with tRNA gene multiplicity, complicate sequencing and read mapping efforts. To address these issues, I developed hydro-tRNAseq, a method based on partial alkaline RNA hydrolysis that generates fragments amenable for sequencing. To identify transcribed tRNA genes, I further complemented this approach with Photoactivatable Crosslinking and Immunoprecipitation (PAR-CLIP) of SSB/La, a conserved protein involved in pre-tRNA processing. My results show that approximately half of all predicted tRNA genes are transcribed in human cells, suggesting that the tRNA genomic space is more contracted than previously thought as a result of regulation of expression. I also report predominant nucleotide modification sites, their order of incorporation, and identify tRNA leader, trailer and intron sequences. By using complementary sequencing-based methodologies I present a human tRNA reference set, and determine expression levels of mature and processing intermediates of tRNAs in human cells. The technical advances provided by hydro-tRNAseq are applied towards the molecular diagnosis of a genetic neurodevelopmental syndrome, caused by mutations in the tRNA processing factor CLP1. Finally, I harness this novel experimental and computational expertise towards the identification of the endonuclease complex C3PO as a novel processing factor of human tRNAs. I carry out a transcriptome-wide analysis of C3PO targets, identify its binding sites and motifs, and provide insights into its biochemical and biological functions

    Algorithmic methods for systems biology of Herpes-viral microRNAs

    Get PDF
    Recent technological advances have made it possible to measure various parameters of biological processes in a genome-wide manner. While traditional molecular biology focusses on individual processes using targeted experiments (reductionistic approach), the field of systems biology utilizes high-throughput experiments to determine the state of a complete system such as a cell at once (holistic approach). Systems biology is not only carried out in wet-lab, but for the most part also requires tailored computational methods. High-throughput experiments are able to produce massive amounts of data, that are often too complex for a human to comprehend directly, that are affected by substantial noise, i.e. random measurement variation, and that are often subject to considerable bias, i.e. systematic deviations of the measurement from the truth. Thus, computer science and statistical methods are necessary for a proper analysis of raw data from such large-scale experiments. The goal of systems biology is to understand a whole system such as a cell in a quantitative manner. Thus, the computational part does not end with analyzing raw data but also involves visualization, statistical analyses, integration and interpretation. One example for these four computational tasks is as follows: Processes in biological systems are often modeled as networks, for instance, gene regulatory networks (GRNs) that represent the interactions of transcription factors (TFs) and their target genes. Experiments can provide both, the identity and wiring of all constituent parts of the network as well as parameters that allow to describe the processes in the system in a quantative manner. A network provides a straight-forward way to visualize the state and processes of a whole system, its statistical analysis can reveal interesting properties of biological systems, it is able to integrate several datasets from various experiments and simulations of the network can aid to interpret the data. In recent years, microRNAs emerged as important contributors to gene regulation in eukaryotes, breaking the traditional dogma of molecular biology, where DNA is transcribed to RNA which is subsequently translated into proteins. MicroRNAs are small RNAs that are not translated but functional as RNAs: They are able to target specific messenger RNAs (mRNA) and typically lead to their downregulation. Thus, in addition to TFs, microRNAs also play important roles in GRNs. Interestingly, not only animal genomes including the human genome encode microRNAs, but microRNAs are also encoded by several pathogens such as viruses. In this work I developed several computational systems biology methods and applied them to high-throughout experimental data in the context of a project about herpes viral microRNAs. Three methods, ALPS, PARma and REA, are designed for the analysis of certain types of raw data, namely short RNA-seq, PAR-CLIP and RIP-Chip data, respectively. All of theses experiments are widely used and my methods are publicly available on the internet and can be utilized by the research community to analyze new datasets. For these methods I developed non-trivial statistical methods (e.g. the EM algorithm kmerExplain in PARma) and implemented and adapted algorithms from traditional computer science and bioinformatics (e.g. alignment of pattern matrices in ALPS). I applied these novel methods to data measured by our cooperation partners in the herpes virus project. I.a., I discovered and investigated an important aspect of microRNA-mediated regulation: MicroRNAs recognize their targets in a context-dependent manner. The widespread impact of context on regulation is widely accepted for transcriptional regulation, and only few examples are known for microRNA-mediated regulation. By integrating various herpes-related datasets, I could show that context-dependency is not restricted to few examples but is a widespread feature in post-transcriptional regulation mediated by microRNAs. Importantly, this is true for both, for human host microRNAs as well as for viral microRNAs. Furthermore, I considered additional aspects in the data measured in the context of the herpes virus project: Alternative splicing has been shown to be a major contributor to protein diversity. Splicing is tightly regulated and possibly important in virus infection. Mass spectrometry is able to measure peptides quantitatively genome-wide in high-throughput. However, no method was available to detect splicing patterns in mass spectrometry data, which was one of the datasets that has been meausred in the project. Thus, I investigated whether mass spectrometry offers the opportunity to identify cases of differential splicing in large-scale. Finally, I also focussed on networks in systems biology, especially on their simulation. To be able to simulate networks for the prediction of the behavior of systems is one of the central goals in computational systems biology. In my diploma thesis, I developed a comprehensive modeling platform (PNMA, the Petri net modeling application), that is able to simulate biological systems in various ways. For highly detailed simulations, I further developed FERN, a framework for stochastic simulation that is not only integrated in PNMA, but also available stand-alone or as plugins for the widely used software tools Cytoscape or CellDesigner. In systems biology, the major bottleneck is computational analysis, not the generation of data. Experiments become cheaper every year and the throughput and diversity of data increases accordingly. Thus, developing new methods and usable software tools is essential for further progress. The methods I have developed in this work are a step into this direction but it is apparent, that more effort must be devoted to keep up with the massive amounts of data that is being produced and will be produced in the future.Der technische Fortschritt in den letzten Jahren hat ermöglicht, dass vielerlei Parameter von biologischen Prozessen genomweit gemessen werden können. Während die traditionelle Molekularbiologie sich mit Hilfe gezielter Experimente auf individuelle Prozesse konzentriert (reduktionistischer Ansatz), verwendet das Feld der Systembiologie Hochdurchsatz-Experimente um den Zustand eines vollständigen Systems wie einer Zelle auf einmal zu bestimmen (holistischer Ansatz). Dabei besteht Systembiologie nicht nur aus Laborarbeit, sondern benötigt zu einem großen Teil auch speziell zurechtgeschnittene computergestützte Methoden. Hochdurchsatz-Experimente können riesige Mengen an Daten produzieren, welche oft zu komplex sind um von einem Menschen direkt verstanden zu werden, welche beeinträchtigt sind von substantiellem Rauschen, das heißt zufälliger Messvariation, und welche oft beträchtlichem Bias unterliegen, also systematischen Abweichungen der Messungen von der tatsächlichen Größe. Daher sind informatische und statistische Methoden notwendig für eine geeignete Analyse der Rohdaten eines groß angelegten systembiologischen Experiments. Das Ziel der Systembiologoe ist ein ganzen System wie eine Zelle in quantitativer Weise zu verstehen. Daher endet der computergestützte Teil nicht mit der Analyse der Rohdaten, sondern beinhaltet ebenfalls Visualisierung, statistische Analyse, Integration und Interpretation. Ein Beispiel dieser vier rechnergestützten Aufgaben ist wie folgt: Prozesse in biologischen Systemen werden oft in Netzwerken modelliert. Zum Beispiel werden in genregulatorischen Netzwerken (GRNs) die Interaktionen zwischen Transkriptionsfaktoren (TFs) und deren Zielgenen repräsentiert. Mit Experimenten kann man sowohl die Identität und die Vernetzung aller Bestandteile des Netzwerkes messen, wie auch die Parameter, mit denen man die Prozesse des Systems in quantitativer Weise beschreiben kann. Mit Hilfe eines Netzwerkes kann man auf einfache und direkte Weise den Zustand und die Prozesse eines ganzen Systems visualisieren, die statistische Analyse des Netzwerks kann interessante Eigenschaften eines biologischen Systems aufdecken, es bietet die Möglichkeit, verschiedene experimentelle Daten zu integrieren und seine Simulation kann bei der Interpretation der Daten helfen. Erst vor wenigen Jahren stelle sich heraus, dass sogenannte microRNAs die Genregulation in Eukaryonten maßgeblich beeinflussen. Das steht im Widersprich zum traditionellen Dogma der Molekularbiologie, bei dem die genetische Information aus der DNA in RNA transkribiert wird, welche anschließend in Proteine translatiert wird. MicroRNAs hingegen sind kurze RNAs, welche nicht translatiert werden, sondern als RNAs funktional sind. Sie können spezifische messenger RNAs (mRNAs) binden und führen dann typischerweise zu deren Inhibition. Zusätzlich zu Transkriptionsfaktoren spielen also microRNAs eine wichtige Rolle in GRNs. Interessanterweise enkodieren nicht nur tierische Genome, das menschliche Genom eingeschlossen, microRNAs, sondern viele Pathogene wie Viren exprimieren ihre eigenen microRNAs in infizierten Wirtszellen. In dieser Arbeit habe ich mehrere computergestützte Methoden für die Anwendung in der Systembiologie entwickelt und auf Hochdurchsatz-Daten angewendet, die im Kontext eines Projektes über herpesvirale microRNAs vermessen wurden. Drei Methoden, ALPS, PARma und REA, habe ich für die Analyse von bestimmten Typen von Rohdaten entworfen, nämlich jeweils short RNA-seq, PAR-CLIP und RIP-Chip. All diese Experimente sind weit verbreitet im Einsatz und meine Methoden sind im Internet öffentlich verfügbar und können von der Forschungsgemeinschaft zur Analyse der Rohdaten der jeweiligen Experimente verwendet werden. Für diese Methoden entwickelte ich nicht-triviale statistische Methoden (z.B. den EM Algorithmus kmerExplain in PARma) und implementierte und adaptierte Algorithmen aus der traditionellen Informatik wie auch aus der Bioinformatik (z.B. Sequenzalignment der Mustermatrizen in ALPS). Ich wendete diese neuen Methoden auf Daten an, die von unseren Kooperationspartner im Herpesviren Projekt gemessenen wurden. Dabei entdeckte und erforschte ich unter anderem einen wichtigen Aspekt der Regulation durch microRNAs: MicroRNAs erkennen ihre Targets in kontext-abhängiger Weise. Die weitverbreiteten Auswirkungen von Kontext ist weithin akzeptiert für transkriptionelle Regulation und es sind nur wenige Beispiele von kontext-spezifischer microRNA gesteuerte Regulation bekannt. Indem ich mehrere Herpes-relevante Datensätze integriert analysiert habe, konnte ich zeigen, dass Kontext-Abhängigkeit nicht nur auf ein paar Beispiele beschränkt ist, sondern dass es ebenfalls ein weitverbreitetes Merkmal der post-transkriptionellen Regulation gesteuert durch microRNAs ist, dass Zielgene kontext-abhängig erkannt werden. Das gilt sowohl für die menschlichen microRNAs der Wirtszelle wie auch für die exogenen viralen microRNAs. Desweiteren habe ich zusätzliche Aspekte der Daten des Herpesviren-Projektes betrachtet: Es wurde gezeigt, dass alternatives Spleißen maßgeblich zur Diversität von Proteinen beiträgt. Spleißen ist streng reguliert und möglicherweise wichtig bei der Virusinfektion. Massenspektrometrie kann Peptide genomweit in quantitativer Weise messen. Allerdings stand keine Methode zur Verfügung, um Spleiß-Muster in Massenspektrometrie-Daten, wie sie im Projekt gemessen wurden, zu detektieren. Aus diesem Grund habe ich untersucht, ob es mit Massenspektrometrie-Daten möglich ist, Fälle von alternativen Spleißen im großen Umfang zu identifizieren. Letztendlich habe ich mich auch auf systembiologische Netzwerke und im Speziellen auf deren Simulation konzentriert. Netzwerke simulieren zu können um das Verhalten von Systemen vorherzusagen ist eines der zentralen Ziele der rechnergestützten Systembiologie. Bereits in meiner Diplomarbeit habe dafür ich eine umfassende Modellierplatform (PNMA, the Petri net modelling application) entwickelt. Damit ist es möglich, biologische Systeme auf vielerlei Arten zu simulieren. Für sehr detailierte Simulationen habe ich dann FERN entwickelt, ein Framework zur stochastischen Simulation, welches nicht nur in PNMA integriert ist, sondern auch als eigenständige Software wie auch also Plugin für die weitverbreiteten Programme Cytoscape und CellDesigner verfügbar ist. Der Engpass in der Systembiologie ist mehr und mehr die rechnergestützte Analyse der Daten und nicht deren Generierung. Experimente werden jedes Jahr günstiger und der Durchsatz und die Diversität der Daten wächst dementsprechend. Daher is es für den weiteren wissenschaftlichen Fortschritt essentiell, neue Methoden und benutzbare Softwarepakete zu entwickeln. Die Methoden, die ich in dieser Arbeit entwickelt habe, stellen einen Schritt in diese Richtung dar, aber es ist offensichtlich, dass mehr Anstrengungen aufgewendet werden müssen, um Schritt halten zu können mit den riesigen Mengen an Daten die produziert werden und in der Zukunft noch produziert werden
    corecore