Exploring the interactions between neuron degeneration and RNA homeostasis through biological network analysis

Abstract

Tese de mestrado em Bioquímica, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2016A esclerose lateral amiotrófica (ALS) e a atrofia muscular espinal (SMA) são caracterizadas pela degeneração dos neurónios motores (MN) e são comummente conhecidas como doenças neuromusculares, ou mais especificamente doenças do neurónio motor (MND). A morte dos neurónios motores está diretamente envolvida na perda da inervação muscular e na consequente atrofia muscular. Para além da convergência fenotípica, estas doenças também partilham grandes semelhanças moleculares. A perda de função dos genes que codificam as proteínas FUS, TDP43, SETX e SOD1 são as causas mais conhecidas de ALS. No caso da SMA, a doença é provocada pela produção de formas não funcionais da proteína SMN. Sabe-se que as proteínas FUS, TDP43, SMN e SETX (FTSS) interagem fisicamente e, além disso, são conhecidas por estarem envolvidas num conjunto de funções semelhantes, muitas das quais estão relacionados com os processos de metabolismo do RNA. Esta observação levou a hipótese de que a ALS e a SMA são fenótipos patológicos que, apesar de diferentes, derivam de mecanismos moleculares semelhantes, possivelmente associados a perturbação da hemóstase do RNA. No entanto, é muito intrigante como eventos transversais a todos os tipos celulares podem induzir a morte específica dos neurónios motores. A fim de resolver estas questões nos propomos uma abordagem de biologia de sistemas para descrever a estrutura interactomica e funcional da degeneração dos neurónios motores. A biologia de sistemas (systems biology) baseia-se no pressuposto de que "o todo é mais do que a soma das partes". Utiliza uma abordagem holística para decifrar a complexidade dos sistemas biológicos e para isso integra muitas disciplinas cientificas como a biologia, ciências computacionais, estatística e matemática. A biologia de sistemas concebe as entidades biológicas como sistemas complexos de elementos interrelacionados. Deste modo, uma boa maneira de entender as suas propriedades e representando-as como redes (networks). A biologia de redes (networks biology) e um subcampo da biologia de sistemas que explora os princípios da teoria de redes para inferir informação biológica. Da mesma forma, as doenças são o resultado fenotípico de perturbações interrelacionadas e assim também podem ser representadas como redes biológicas. A medicina de redes e, por sua vez, focalizada na obtenção de conhecimento biomédico a partir da biologia de redes. O nosso principal objetivo e, em primeiro lugar, identificar os elementos mais centrais numa rede de interação proteína-proteína contendo os genes associados a ALS e a SMA. Estes elementos serão parte de mecanismos patológicos hipoteticamente envolvidos na degeneração dos neurónios motores. Considerando a hipótese de que as proteínas FTSS são elementos centrais nas MNDs, realizamos primeiramente uma analise exploratória para desvendar as funções mais influentes entre as proteínas FTSS. Para isso foi construída uma rede de interações proteína-proteína (PPI) constituída pelos interactores mais próximos as proteínas FTSS, o que nos permite identificar as funções mais sobre-representadas dentro da rede. Embora, sabendo que as proteínas FTSS não são as únicas proteínas associadas as MNDs, também realizamos uma exploração mais integrativa incluindo todos os DAGs (genes associados a doença) conhecidos para a ALS e SMA e aplicando um método de priorização de DAGs para prever os elementos mais centrais a ligar as duas patologias. Contudo, depois de fazer extensa uma pesquisa bibliográfica, não encontramos nenhum método com um objectivo semelhante, pelo que construímos um método novo com base em teoria de redes para prever os nos que ligam especificamente os DAGs associados a um par de doenças. O método S2B foi concebido a partir do pressuposto de que as proteínas que interagem com um DAG são provavelmente relacionadas com a mesma doença (constituindo módulos de doenças na rede) e também que os DAGs são propensos a ser associados a mais do que uma doença (os módulos de doenças podem sobrepor-se). Assim, o método S2B está focado na medição dum tipo particular de medida de centralidade (S2B betweenness). O betweeness e uma medida de centralidade popular em biologia de redes que conta as vezes que um no está envolvido num caminho mais curto (shortest path) numa rede. Geralmente o betweeneess standard é medido para todos os possíveis caminhos mais curtos entre quaisquer nos enquanto que o S2B betweenness apenas considera os caminhos mais curtos entre pares de DAGs. Portanto, o método S2B só prioriza a centralidade dos elementos ligando genes causativos de duas doenças. Alem disso, sabendo que os nos altamente conectados (hubs) são mais propensos a aparecer por acaso num caminho mais curto entre DAGs, o algoritmo do S2B também utiliza dois algoritmos estatísticos baseados em aleatorizações da rede com os quais mede a especificidade dos hubs no contexto das doenças em estudo. As proteínas resultantes da priorização realizada pelo S2B foram enriquecidas funcionalmente. Os resultados da análise de enriquecimento foram comparados com os resultados obtidos na análise da rede particular para as proteínas FTSS para assim, explorar qual e o papel do metabolismo do RNA e outros mecanismos moleculares hipotéticos na degeneração dos neurónios motores. No conjunto das várias abordagens seguidas, este trabalho levou a descoberta de novos processos biológicos candidatos a mecanismos moleculares comuns entre a ALS e a SMA, mas também confirmou alguns processos já conhecidos simultaneamente envolvidos na ALS e na SMA. Globalmente, os nossos resultados sugerem cinco vias moleculares principais em comum nas duas patologias: 1) danos no DNA e apoptose induzidos pela desregulação da formação de “R-loops”, 2) inflamação e neuro degeneração induzida por uma hipersensibilidade imunológica, 3) desregulação da cromatina e genotoxicidade produzida pela perturbação da biogénese de histonas, 4) alteração dos padrões de “splicing” e genotoxicidade criada pela falha da formação do spliceossoma e 5) desregulação de processos relacionados com microtubulos que levam a problemas morfológicos na formação de axónios e sinapses. As vias identificadas sugerem novas hipóteses que podem ser experimentalmente testadas. Assim, esta investigação pode ajudar a melhorar a compreensão dos mecanismos envolvidos na morte dos neurónios motores e também ajudar eventualmente ao desenho de alvos terapêuticos e biomarcadores para as MNDs. Alem disso, também fornecemos um novo método para a priorização de DAGs candidatos a ligar os mecanismos moleculares de duas doenças relacionadas. Tal como no caso das MNDs, esperamos que este método ajude a comunidade a estudar outros tipos de doenças complexas.Amyotrophic lateral sclerosis (ALS) and spinal muscular atrophy (SMA) are characterized by motor neuron (MN) degeneration and commonly referred as motor neuron diseases (MND). MN degeneration leads to the loss of muscle innervation and subsequent muscular atrophy. In addition to phenotypic similarity, they also share molecular overlaps. Genes that codify FUS, TDP43, SETX and SOD1 proteins are the best-known causative genes of ALS and SMN dysfunction is the cause of SMA. FUS, TDP43, SMN and SETX (FTSS) proteins are known to physically interact and are involved in similar functions, many of which related to RNA metabolism processes. This supports the hypothesis that ALS and SMA are different pathophenotypic results derived from related molecular origins, in particular from RNA homeostasis perturbation. However, it is very intriguing how such critical events could specifically induce motor neuron perturbation. Besides, RNA metabolism is not the only function described for MND associated genes, indeed FTSS proteins are highly multifunctional which hinders the identification of the most relevant functions in this context. In order to solve these questions we followed a systems biology approach exploring the interactomic and functional framework of MN degeneration. Under the hypothesis that FTSS proteins are central elements in MN degeneration, we performed a local network analysis to unravel the most influential functions among FTSS proteins. We constructed a protein-protein interaction (PPI) network constituted by FTSS proteins' common interactors to identify the most over represented functions within this FTSS-focused network. We also performed a PPI network analysis including all the known MND associated genes. For that purpose we developed a new method, S2B (double specific betweenness) to prioritize nodes specifically linking a pair of diseases. While standard betweenness is measured for all possible shortest paths between any nodes, S2B only considers those shortest paths involving Disease Associated Genes (DAGs) from one disease as initial nodes and DAGs from the other disease as final nodes. Therefore, S2B method only prioritizes proteins linking MND causative genes. Moreover, knowing that highly connected nodes (hubs) are more likely found by chance in a shortest paths involving DAGs, S2B method also performs two network randomization-based statistics to filter out proteins that link MND DAGs non specifically. Finally we functionally enriched the prioritized candidates and compared against the functional set obtained with FTTS-focused network in other to explore the role of RNA metabolism and other putative molecular mechanisms on MN degeneration. The combined approaches used in this work provided novel biological processes simultaneously involved in ALS and SMA diseases and confirmed the relevance of known related processes. Globally, our results suggest five pathways in common between ALS and SMA: 1) DNA damage and apoptosis induced by R-loop deregulation, 2) inflammation and neurodegeneration induced by immune hyper-sensitivity, 3) chromatin deregulation and genotoxicity produced by histone biogenesis perturbation, 4) splicing patterns alteration and genotoxicity produced by spliceosome assembly failure and 5) deregulation of microtubule related processes leading to morphological problems in axon and synapse formation. Besides the new hypothesis of common pathomechanisms in MNDs, our work also supplies a new network-based DAG prioritization method, S2B, to identify disease-disease linking candidates we expect to contribute to the study of various complex diseases

    Similar works