331 research outputs found

    Novel Markov model of induced pluripotency predicts gene expression changes in reprogramming

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>Somatic cells can be reprogrammed to induced-pluripotent stem cells (iPSCs) by introducing few reprogramming factors, which challenges the long held view that cell differentiation is irreversible. However, the mechanism of induced pluripotency is still unknown.</p> <p>Methods</p> <p>Inspired by the phenomenological reprogramming model of Artyomov et al (2010), we proposed a novel Markov model, stepwise reprogramming Markov (SRM) model, with simpler gene regulation rules and explored various properties of the model with Monte Carlo simulation. We calculated the reprogramming rate and showed that it would increase in the condition of knockdown of somatic transcription factors or inhibition of DNA methylation globally, consistent with the real reprogramming experiments. Furthermore, we demonstrated the utility of our model by testing it with the real dynamic gene expression data spanning across different intermediate stages in the iPS reprogramming process.</p> <p>Results</p> <p>The gene expression data at several stages in reprogramming and the reprogramming rate under several typically experiment conditions coincided with our simulation results. The function of reprogramming factors and gene expression change during reprogramming could be partly explained by our model reasonably well.</p> <p>Conclusions</p> <p>This lands further support on our general rules of gene regulation network in iPSC reprogramming. This model may help uncover the basic mechanism of reprogramming and improve the efficiency of converting somatic cells to iPSCs.</p

    A stochastic model dissects cell states in biological transition processes

    Get PDF
    Many biological processes, including differentiation, reprogramming, and disease transformations, involve transitions of cells through distinct states. Direct, unbiased investigation of cell states and their transitions is challenging due to several factors, including limitations of single-cell assays. Here we present a stochastic model of cellular transitions that allows underlying single-cell information, including cell-state-specific parameters and rates governing transitions between states, to be estimated from genome-wide, population-averaged time-course data. The key novelty of our approach lies in specifying latent stochastic models at the single-cell level, and then aggregating these models to give a likelihood that links parameters at the single-cell level to observables at the population level. We apply our approach in the context of reprogramming to pluripotency. This yields new insights, including profiles of two intermediate cell states, that are supported by independent single-cell studies. Our model provides a general conceptual framework for the study of cell transitions, including epigenetic transformations

    Nanog dynamics in mouse embryonic stem cells

    Get PDF
    Mouse embryonic stem cells (mESCs), derived from the inner cell mass of the blastocyst, are pluripotent stem cells having self-renewal capability and the potential of differentiating into every cell type under the appropriate culture conditions. An increasing number of reports have been published to uncover the molecular mechanisms that orchestrate pluripotency and cell fate specification using combined computational and experimental methodologies. Here, we review recent systems biology approaches to describe the causes and functions of gene expression heterogeneity and complex temporal dynamics of pluripotency markers in mESCs under uniform culture conditions. In particular, we focus on the dynamics of Nanog, a key regulator of the core pluripotency network and of mESC fate. We summarize the strengths and limitations of different experimental and modeling approaches and discuss how various strategies could be used

    Physics of epigenetic landscapes and statistical inference by cells

    Full text link
    Biology is currently in the midst of a revolution. Great technological advances have led to unprecedented quantitative data at the whole genome level. However, new techniques are needed to deal with this deluge of high-dimensional data. Therefore, statistical physics has the potential to help develop systems biology level models that can incorporate complex data. Additionally, physicists have made great strides in understanding non-equilibrium thermodynamics. However, the consequences of these advances have yet to be fully incorporated into biology. There are three specific problems that I address in my dissertation. First, a common metaphor for describing development is a rugged "epigenetic landscape" where cell fates are represented as attracting valleys resulting from a complex regulatory network. I introduce a framework for explicitly constructing epigenetic landscapes that combines genomic data with techniques from spin-glass physics. The model reproduces known reprogramming protocols and identifies candidate transcription factors for reprogramming to novel cell fates, suggesting epigenetic landscapes are a powerful paradigm for understanding cellular identity. Second, I examine the dynamics of cellular reprogramming. By reanalyzing all available time-series data, I show that gene expression dynamics during reprogramming follow a simple one-dimensional reaction coordinate that is independent of both the time and details of experimental protocol used. I show that such a reaction coordinate emerges naturally from epigenetic landscape models of cell identity where cellular reprogramming is viewed as a "barrier-crossing" between the starting and ending cell fates. Overall, the analysis and model suggest that gene expression dynamics during reprogramming follow a canonical trajectory consistent with the idea of an "optimal path"' in gene expression space for reprogramming. Third, an important task of cells is to perform complex computations in response to external signals. Intricate networks are required to sense and process signals, and since cells are inherently non-equilibrium systems, these networks naturally consume energy. Since there is a deep connection between thermodynamics, computation, and information, a natural question is what constraints does thermodynamics place on statistical estimation and learning. I modeled a single chemical receptor and established the first fundamental relationship between the energy consumption and statistical accuracy of a receptor in a cell

    Systematic Search for Recipes to Generate Induced Pluripotent Stem Cells

    Get PDF
    Generation of induced pluripotent stem cells (iPSCs) opens a new avenue in regenerative medicine. One of the major hurdles for therapeutic applications is to improve the efficiency of generating iPSCs and also to avoid the tumorigenicity, which requires searching for new reprogramming recipes. We present a systems biology approach to efficiently evaluate a large number of possible recipes and find those that are most effective at generating iPSCs. We not only recovered several experimentally confirmed recipes but we also suggested new ones that may improve reprogramming efficiency and quality. In addition, our approach allows one to estimate the cell-state landscape, monitor the progress of reprogramming, identify important regulatory transition states, and ultimately understand the mechanisms of iPSC generation

    Population-level dynamics of human pluripotent stem cell fate transitions

    Get PDF
    Tese de mestrado, Biologia Molecular e Genética, Universidade de Lisboa, Faculdade de Ciências, 2019As células estaminais são células indiferenciadas com a capacidade de auto-renovação e diferenciação em células especializadas, em condições apropriadas. Desempenham funções fundamentais em diversas fases do desenvolvimento, podendo ser totipotentes, pluripotentes, multipotentes e unipotentes. As células estaminais pluripotentes humanas (hPSC), incluindo células estaminais embrionárias humanas (hESC) e células estaminais pluripotentes induzidas humanas (hiPSC), têm como principais aplicações a descoberta de fármacos, a modelação de doenças e a medicina regenerativa. O desenvolvimento embrionário humano inicia-se com a fusão dos gâmetas masculino e feminino, gerando-se reprogramações epigenéticas, uma série de divisões mitóticas (clivagem), degradação dos transcriptos maternos e ativação do genoma embrionário. De seguida, o embrião sofre compactação e cavitação, passando pelo estágio de mórula, até formar a blástula. A massa celular interna (ICM) do blastocisto diverge entre as células do epiblasto e da endoderme primitiva (hipoblasto), seguindo-se a implantação do blastocisto e gastrulação. Durante a gastrulação as células rearranjam-se, transformando o embrião numa estrutura contendo três camadas germinativas - ectoderme, mesoderme e endoderme. De forma semelhante, muitos métodos de diferenciação in vitro visam o comprometimento de hPSC numa linhagem multipotente, que dará origem ao tipo celular de interesse. Deste modo, a diferenciação de hPSC numa linhagem celular pretendida requer a regulação complexa de diversas vias de sinalização, através de fatores de crescimento, citocinas e pequenas moléculas. Quando as hPSC são induzidas com Wnt, Activina A ou BMP4, estas células formam uma população semelhante à linha primitiva e subsequentemente, a mesoderme ou endoderme. As células da linha primitiva posterior dão origem à mesoderme, seguindo-se a formação da mesoderme cardíaca e dos progenitores cardíacos, os quais geram células diferenciadas. Alternativamente, as células da linha primitiva anterior podem ser induzidas por Activina/Nodal e deste modo formar endoderme definitiva FOXA2+, seguindo-se a formação de hepatoblastos, que irão dar origem a hepatócitos. Caso estas vias não sejam ativas, as hPSC irão diferenciar-se em ectoderme. A diferenciação de hiPSC em neurónios transita através de diversos estadios intermediários. As hiPSC diferenciam-se em progenitores neurais/células estaminais neuroepiteliais que se assemelham às células estaminais neurais (NSC), que formam o tubo neural in vivo. Durante a neurulação in vivo, o tubo neural fecha e formam-se os primeiros tipos de neurónios. O passo correspondente in vitro é a formação de rosetas neurais, que irão dar origem a células da glia e neurónios. A investigação dos mecanismos que regulam as decisões celulares e especificação de sub-populações é fundamental para uma melhor compreensão do desenvolvimento humano embrionário in vivo e sua modelação in vitro. Este conhecimento poderá vir a ser explorado para a medicina regenerativa, modelação de doenças e descoberta de fármacos. No entanto, abordagens sistemáticas para a cultura e diferenciação de células estaminais permanecem pouco desenvolvidas. Esta necessidade tecnológica surgiu como o grande propósito deste estudo, sendo o seu objetivo principal a análise de processos robustos e reprodutíveis para a diferenciação de hPSC. Com este fim, começámos por expandir uma base de dados génica, de modo a abranger o maior número possível de genes associados à especificação de linhagens celulares derivadas de cada uma das três camadas germinativas. De seguida, analisámos as proteínas codificadas pelos genes dessa base de dados aumentada, de modo a identificar quais os processos biológicos e vias de sinalização enriquecidos associados. Ainda, foi possível delinear um percurso representativo do desenvolvimento humano, reconstruindo-se as trajetórias de diferenciação pelas quais as hPSC elaboram sequencialmente uma diversidade de linhas celulares derivadas da neuroectoderme, mesoderme cardíaca e endoderme hepática. Esta abordagem revelou os eventos moleculares sequenciais que regulam o estabelecimento dos três diferentes tipos celulares analisados. Para este estudo desenvolveram-se abordagens de transcriptómica e de modelação de redes, com base nos dados de sequenciação de RNA (RNA-Seq) de células diferenciadas. Esta análise permitiu revelar as vias de sinalização e perfis de expressão génica responsáveis pela indução eficiente de cada uma destas linhagens em diversos pontos temporais. Esta estratégia foi desenvolvida ao nível da expressão global de genes e, posteriormente, com enfoque exclusivo em genes que codificam fatores de transcrição, uma vez que estes controlam uma rede regulatória de programas de expressão génica, despoletando diversas respostas celulares. Deste modo, desenvolveu-se uma análise que incluiu a normalização de dados, visualização de dados de transcriptómica por heatmaps, PCAs (Principal Component Analysis) e diagramas de Venn, e investigação dos processos biológicos e principais vias de sinalização associados à expressão génica. Demonstrou-se que os cardiomiócitos derivados de hiPSC (hiPSC-CM) e os neurónios derivados de hiPSC (hiPSC-Neurons) exibiram uma diferenciação progressiva robusta, quando comparados a tecidos fetais e adultos cardíacos e cerebrais, respetivamente. Deste modo, em termos de expressão génica, os nossos métodos de diferenciação cardíaca e neural revelaram-se bem sucedidos. Realizou-se ainda uma comparação entre os protocolos que estabelecemos para a diferenciação cardíaca e neural com protocolos distintos para a obtenção dos mesmos tipos celulares, embora por intermédio de diferentes linhas celulares, fatores de diferenciação e/ou meios de cultura. Apesar destas diferenças, uma análise de PCA mostrou que os diversos grupos surgiram por ordem cronológica, claramente distinguindo as amostras de diferentes estadios de diferenciação, permitindo definir as trajetórias de linhagens celulares, validando a nossa eficiência de diferenciação. Adicionalmente, foi analisada a expressão de genes que apenas codificam fatores de transcrição, regulando a diferenciação de hiPSC-CM, hiPSC-Neurons e de hepatócitos derivados de hESC. A análise de PCA evidenciou a existência de diferenças consideráveis entre estas três diferenciações, dada a existência de redes génicas distintas a regular linhagens celulares específicas. De seguida, procurou-se identificar os padrões de expressão génica que modulam a especificação progressiva da ectoderme e da mesoderme, bem como os seus principais papéis funcionais. Assim, compararam-se as alterações de expressão génica em fases sequenciais da diferenciação neural e cardíaca, juntamente como uma análise dos genes diferencialmente expressos (DEGs) (Differentially Expressed Genes) no Gene Ontology (GO). Esta abordagem foi desenvolvida tanto a um nível global de expressão de genes, como posteriormente direcionada apenas para genes que codificam fatores de transcrição. Ambas demonstraram diferenças consideráveis entre os DEGs durante a diferenciação em ectoderme comparativamente à diferenciação em mesoderme, em termos de expressão de genes e suas funções associadas, bem como na modulação de vias de sinalização, os quais foram devidamente identificados. Estes resultados permitiram comparar e discriminar as principais alterações de expressão génica e respetivos processos biológicos enriquecidos, durante a transição de um estado de pluripotência para um comprometimento em ectoderme ou mesoderme. Adicionalmente, foi feito um screening de genes que apenas codificam fatores de transcrição em fases comuns da diferenciação em três datasets (hiPSC-Neurons, hiPSC-CM e hepatócitos derivados de hESC). Deste modo, foi possível identificar que fatores de transcrição estão particularmente envolvidos em fases sequenciais da especificação de cada camada germinativa. Para concluir, realizou-se um estudo do perfil de alterações transcripcionais em fases sequenciais, através da comparação de dois datasets de RNA-Seq para cada tipo de diferenciação. Esta estratégia foi utilizada para analisar com maior precisão alterações determinadas e suportadas por ambos os datasets para cada tipo de diferenciação, validando as nossas observações. Apesar das diferenças entres os protocolos de diferenciação e linhas celulares utilizadas, os dois tipos de neurónios diferenciados continuaram a exibir transcriptomas altamente concordantes durante a diferenciação neural, evidenciados por picos específicos de expressão génica que ocorreram aproximadamente nos mesmos pontos temporais da diferenciação, apresentando tendências similares de expressão. O mesmo se observou entre os dois datasets cardíacos que foram analisados. Esta investigação permitiu ainda identificar novos reguladores putativos da cardiogénese (HOXB4, HOXB5, HOXB6 e RARB) e neurogénese (TERF2IP, RFX4 e ZHX1), os quais foram subsequentemente validados por Quantitative Real-Time Polymerase Chain Reaction (qRT-PCR). Globalmente, os resultados obtidos por qRT-PCR foram concordantes com os dados de RNA-Seq. Adicionalmente, a eficiência da diferenciação cardíaca foi confirmada por citometria de fluxo, validando assim os resultados obtidos por qRT-PCR ao longo da diferenciação. A caracterização transcriptómica efetuada definiu um mapeamento representativo do desenvolvimento da neuroectoderme e mesoderme cardíaca, revelando picos de expressão temporal quer de marcadores específicos de cada linhagem, quer de novos candidatos envolvidos na diferenciação. Estes resultados evidenciaram uma diferenciação eficiente de hPSC nos tipos celulares pretendidos. Em suma, este estudo pretendeu contribuir para a análise de modelos de cultura celular que possam mimetizar a função in vivo, apresentando dados que poderão ser utilizados futuramente na otimização de protocolos de diferenciação. Deste modo, pretendemos fornecer informação importante relativa aos mecanismos que controlam as transições das hPSC, com implicações no conhecimento acerca da diferenciação de células estaminais em diferentes linhagens celulares, na biologia celular e do desenvolvimento, e na medicina regenerativa. Esperamos que esta área de investigação se mantenha altamente dinâmica num futuro próximo.Stem cells are undifferentiated cells with the ability to self-renew and differentiate into specialized cells, under appropriate conditions. During gastrulation cells rearrange themselves transforming the early embryo into a multi-layered structure containing three germ layers, endoderm, mesoderm and ectoderm. Accordingly, pluripotent stem cells (PSC), e.g. embryonic stem cells (ESC) or induced pluripotent stem cells (iPSC), differentiate into cells of all three primitive germ layers. Differentiating stem cells negotiate branching lineage choices, avoiding alternate fates to decisively commit to a single lineage. However, the regulatory mechanisms underlying PSC differentiation into specific lineages remain elusive. Here, we define a representative roadmap for early human development and reconstruct the differentiation trajectories by which pluripotent cells sequentially elaborate diverse neuroectodermal, cardiac mesodermal and hepatic endodermal progeny. Tracking these three-germ layer-derived lineage-choices in vitro uncovers the sequential molecular events that ultimately lead to the establishment of different cell types. Therefore, we provide a comprehensive study through transcriptomic and network modeling approaches, based on RNA-Sequencing data, to investigate the critical changes that may occur during human early cardiogenesis, neurogenesis and hepatogenesis, mimicked by human PSC-derived cardiomyocytes, neurons and hepatocytes. In addition, published datasets were also analysed to cover multiple cellular lineages and construct the developmental trajectories of cells derived from all three germ layers, as well as to identify key lineage specifiers. This paved the way for a deeper understanding of the regulatory mechanisms driving distinct cellular subpopulations present at each differentiation stage. To that aim, we have developed two main approaches, one comprising global gene expression of lineage specifiers and another focusing solely on genes encoding transcription factors, as key regulators of cellular decisions. Interestingly, this transcriptomic analysis allowed us to identify novel key putative regulators of cardiogenesis (HOXB4, HOXB5, HOXB6 and RARB) and neurogenesis (TERF2IP, RFX4 and ZHX1), whose expression results throughout differentiation have been validated by Quantitative Real Time Polymerase Chain Reaction. Collectively, these data provide a starting point to better understand the mechanisms that control human PSC fate transitions, revealing the cellular landscape of human PSC early differentiation. We expect that this knowledge might one day be exploited for developmental cell biology, regenerative medicine, disease modeling and drug discovery applications
    corecore