Bioinformatic Reconstruction of Gene Regulatory Networks Controlling EMT and Mesoderm Formation

Abstract

Embryonic development is a complex multi-stage process, which at the gene expression level requires precise control by gene regulatory networks (GRNs). At each stage of pattern formation and organogenesis, during the transition of precursor cells to their descendants, various sets of signaling molecules and transcription factors (TFs) activate or repress their target genes to determine distinct cell fates. Misregulation of developmental pathways may cause severe diseases or lethality, while their ectopic activation in the adult organism often results in oncogenic transformation. It is therefore of great importance to decode the transcription factors and understand how they interact and form GRNs controlling developmental processes. Mesoderm formation is vital for embryo development. It occurs during gastrulation and depends on the process of epithelial-mesenchymal transition (EMT). In vertebrates, mesoderm gives rise to various tissues, such as axial skeleton, skeletal muscle, heart, kidney, smooth muscles, blood vessels and blood. A plethora of studies has been focused on characterizing the genes that regulate the development of mesoderm. Signaling pathways including WNT, BMP and FGF, along with transcription factors such as Smads, Eomes and T have been reported to play fundamental roles in this process. However, the comprehensive mechanistic characterization of the mesodermal GRNs is still lacking. This study aims at constructing a global gene regulatory network, which describes transcriptional regulatory events occurring dynamically during the course of mesoderm formation in the mouse. We demonstrated that in vitro mesodermal differentiation of mouse embryonic stem cells mimics mesoderm formation in vivo, and therefore chose it as a model system. Firstly, by combining ChIP-seq and RNA-seq techniques, I reconstructed GRNs mediated by the essential mesodermal TFs Smads, Eomes and T. Next, to build global dynamic GRN orchestrating EMT and mesoderm formation, time-series gene expression and TF-target datasets were integrated. The latter was obtained by an original method of discovering functionally active TFs from ATAC-seq data, followed by their association with putative target genes. Combing this method with a bioinformatical tool based on hidden Markov model allowed me to identify groups of co-expressed genes from time-series transcriptome data and predict TFs that regulate their expression. The predictive power of this approach was validated by comparing its output with the Smads, Eomes and T datasets, demonstrating that it correctly assigned these TFs to their targets. Using this unbiased approach, novel candidate mesodermal TFs and target genes of previously known TFs were identified. This study expands our understanding of genetic regulation mechanisms underlying EMT and mesoderm formation in the mouse and provides a list of novel potential mesoderm regulators for future in-depth characterization. This bioinformatical approach thus is promising in future studies designed to characterize the molecular mechanism underlying specific developmental processes.Die Embryonalentwicklung ist ein komplexer mehrstufiger Vorgang, der auf der genetischen Ebene eine präzise Kontrolle durch Genregulationsnetzwerke (GRNs) erfordert. Während der Differenzierung von Vorläuferzellen in ihre Nachkommen aktivieren oder unterdrücken verschiedene Gruppen von Transkriptionsfaktoren (TFs) auf jeder Stufe der Musterbildung und der Organogenese ihre Zielgene um bestimmte Zellschicksale festzulegen. Eine Fehlregulation verschiedener Entwicklungsvorgänge kann zu schweren Krankheiten oder zum Tode führen, während deren ektopische Aktivierung im adulten Organismus die Ausbildung von Tumoren induzieren kann. Aus diesem Grund ist es von großer Bedeutung die entsprechenden Transkriptionsfaktoren zu entschlüsseln und herauszufinden, wie sie zum einen interagieren und zum anderen ein GRN bilden das die Entwicklungsprozesse kontrolliert. Die Entstehung des Mesoderms ist bei der Embryonalentwicklung von großer Bedeutung. Sie findet während der Gastrulation statt und ist abhängig von der epithelial-mesenchymalen Transition (EMT). In Wirbeltieren entstehen aus dem Mesoderm verschiedene Gewebe: das axiale Skelett, die Skelettmuskulatur, das Herz, die Nieren, die Blutgefäße und das Blut. In einer Fülle von Studien wurde erläutert, welche Gene die Entstehung des Mesoderms beeinflussen. So ist bekannt, dass die WNT-, BMP- und FGF-Signalwege, zusammen mit TFs, vor allem Smads, Eomes und T, eine grundlegende Rolle bei diesen Vorgängen spielen. Allerdings gibt es bis jetzt noch keine umfassende und mechanistische Beschreibung des mesodermalen GRN. Das Ziel dieser Arbeit ist es, ein globales Genregulationsnetzwerk zu erstellen, welches die transkriptionellen regulatorischen Ereignisse, die dynamisch während der Entstehung des Mesoderms in der Maus auftreten, zu beschreiben. Wir konnten nachweisen, dass die in-vitro Differenzierung von murinen embryonalen Stammzellen die Entstehung des Mesoderms in- vivo nachahmen kann. Aus diesem Grund verwenden wir die in-vitro Differenzierung als Modellsystem. Durch die kombinierte Anwendung von ChIP-Seq- und RNA-Seq-Techniken habe ich zuerst GRNs rekonstruiert, welche durch die für die Mesodermentwicklung wichtigen TFs Smads, Eomes und T gesteuert werden. Um ein globales Genregulationsnetzwerk, das die EMT und die Mesodermentwicklung steuert, zu erstellen, haben wir des weiteren Genexpression-Zeitreihen und Datensätze von Zielgenen bekannter TFs miteinander integriert. Letztere wurden durch einen originären Ansatz erzielt mit dem die funktional aktiven TFs aus ATAC-Seq-Daten ermittelt und mit ihren mutmaßlichen Zielgenen assoziert wurden. Zusammen mit einem bioinformatischen Programm, das auf einem „hidden Markov-Modell“ basiert, konnte ich so Gruppen von koexprimierten Genen identifizieren und die TFs vorhersagen, welche deren Expression regulieren. Wir konnten die Vorhersagekraft unseres Ansatzes bestätigen und beweisen, dass er die TFs ihren Zielen korrekt zuordnet, indem wir die Ergebnisse mit unseren Datensätzen von Smads, Eomes und T verglichen haben. Mittels dieses de novo Ansatzes haben wir sowohl neue Kandidaten für mesodermale TFs identifiziert als auch die sich dynamisch ändernden Gruppen von Zielgenen von schon bekannten TFs charakterisiert. Diese Arbeit erweitert unser Verständnis der der EMT und der Entstehung des Mesoderms zugrundeliegenden genregulatorischen Prozesse in der Maus und stellt eine Liste an neuen potentiellen Regulatoren des Mesoderms für deren zukünftige detaillierte Beschreibungen zur Verfügung. Dieser bioinformatische Ansatz ist daher ein vielversprechender Ansatz für zukünftige Studien, deren Ziel die Charakterisierung molekularer Mechanismen anderer wichtiger Entwicklungsprozesse ist

    Similar works