thesis

Epigenetic biomarkers as predictors of clinical outcomes in colorectal cancer

Abstract

Colorectal Cancer is the third most common cancer and the second leading cause of death by cancer worldwide with about 1.3 million new cancer cases and 693,933 deaths reported in 2012. Here, we intend to determine an epigenetic roadmap of Colorectal Cancer to predict tumor progression and patient outcome. We analyzed whole-genome DNA methylation (Illumina Infinium HumanMethylation 450K array) and gene expression (Illumina HiSeq) in multiple stages of CRC (21 normal, 54 stage I, 131 stage II, 111 stage III, and 51 stage IV). The data is available in TCGA database, and was downloaded, processed and analyzed through R programming. Results show that, in stages I, II, III, and IV, 307, 400, 305 and 233 genes are differentially expressed (fold-change absolute value > 1.5, p-value adjusted 0.2, p-value adjusted<0.05), respectively. In addition, all these CpG sites are correlated with the respective gene. When the KEGG and Gene Ontology analysis was performed, we found that the enriched functions are related to nervous system, one of the processes deregulated in cancer progression. Moreover, we also identified 66, 85, 41, and 40 specific genes for stages I, II, III, and IV, respectively. Regarding the diagnosis, were found 238 genes and 835 CpG sites as good diagnosis tool for stage I (AUC>0.8). Furthermore, 6, 1, and 5 genes and 87, 7, and 3 CpG sites were classified as good biomarkers for overall survival for stages I-IV, respectively. In addition, 3, 3, and 2 genes and 30, 12, 9 CpG sites were identified as good biomarkers for recurrence free survival for stages I-IV, respectively. These results suggest that different methylation events are associated to specific stages of CRC which can predict patient outcome and might improve colorectal cancer diagnosis and prognosis.O cancro colorretal é um evento biológico que compreende múltiplos passos, decorrendo de diversas alterações genéticas e epigenéticas. Apesar das melhorias no rastreio, diagnóstico e prognóstico de cancro, incluindo de cancro colorretal, este continua a ser o terceiro tipo de cancro mais comum em homens e segundo em mulheres, com mais de 1,3 milhões de novos casos diagnosticados, e 693.933 mortes reportados em todo o mundo no ano de 2012. Em parte, a incidência e mortalidade continuam elevadas devido à baixa sensibilidade e especificidade na deteção de cancro colorretal nos estádios iniciais da doença. Atualmente, entre os diversos meios de diagnóstico, a técnica mais eficiente é a colonoscopia, contudo apresenta baixa especificidade e sensibilidade. Estudos mais recentes têm apontado outros biomarcadores como forma de diagnóstico e prognóstico para o cancro colorretal, incluindo a septina 9. Este último é um biomarcador epigenético atualmente comercializado. Este projeto teve como objetivos realizar uma análise global do genoma em termos de metilação do ADN e expressão genética através de um código em R, identificar mutações epigenéticas que ocorram ao longo da progressão do cancro colorretal, e, por último, relacionar estas alterações com o efeito causado nos doentes. Métodos: Neste projeto, foi efetuada uma análise global do genoma de um cohort de cancro colorretal, em termos de metilação do ADN (Illumina Infinium HumanMethylation 450K array) e expressão genética (Illumina HiSeq). Neste projeto, foram analisadas 21 amostras de tecido normal adjacente ao tumor e 347 amostras tumorais divididas de acordo com a classificação TNM (54 estadio I, 131 estadio II, 111 estadio III e 51 estadio IV). Estes dados estão publicamente disponíveis, sendo que foram descarregados da base de dados do The Cancer Genome Atlas (TCGA) e analisados através de programação em R. Resultados: Os resultados sugerem que nos estádios I, II, III e IV, estão diferencialmente expressos 307, 400, 305 e 233 genes (valor absoluto de fold-change > 1,5 e p-value ajustado (FDR) 0,2 e p-value ajustado (FDR) < 0.05), respetivamente. Em adição, cada um destes locais de metilação encontra-se correlacionado com os respetivos genes encontrados diferencialmente expressos no mesmo estadio (p-value < 0.05). De seguida, efetuou-se uma análise nas bases de dados KEGG e Gene Ontology (GO). A utilização destas ferramentas revelou que as funções mais enriquecidas estão relacionadas com o sistema nervoso. Estudos anteriores já tinham descrito alterações em genes envolvidos no desenvolvimento e regulação do sistema nervoso como desreguladas em diversos tipos de cancro. Em adição, foi ainda realizada uma análise com o objetivo de encontrar quais dos genes encontrados diferencialmente expressos e que continham locais de metilação diferencialmente metilados ainda não tinham sido reportados em associação com cancro colorretal e cancro em geral. Esta análise sugere que 87 genes nunca foram associados nem com cancro colorretal nem com cancro no geral. Em oposição, 511 já forma reportados em algum tipo de cancro. Destes últimos, 278 já foram também reportados em cancro colorretal enquanto 233 nunca foram descritos neste tipo de cancro. Como forma de validação, realizou-se, ainda, uma técnica multivariada de representação gráfica, a qual demonstrou que tanto os genes como os locais de metilação selecionados conseguem distinguir amostras tumorais de amostras normais. Esta técnica permitiu-nos ainda diferenciar amostras tumorais em dois grupos principais distintos. Ainda neste estudo, foram identificados 66, 85, 41 e 40 genes que estão somente diferencialmente expressos nos estádios I, II, III e IV. Curiosamente, apenas 85 genes são comuns aos 4 estadios de desenvolvimento de cancro colorretal O potencial dos genes e locais de metilação, encontrados como diferencialmente expressos e metilados, respetivamente, para distinguir tecido tumoral do tecido normal também foi avaliado através da análise de curvas de receiver operating characteristic (ROC). Como resultado, obteve-se que 238 genes e 835 locais de metilação são bons marcadores de tecido tumoral em estadio I, quando comparado com tecido normal adjacente (AUC > 0,8, sendo que apenas foram selecionados os pontos ótimos com especificidade e sensibilidade > 60%). ASTN1, por exemplo, foi um dos genes classificados como um excelente marcador de diagnóstico (AUC =0,989). Este gene contém ainda o local de metilação cg08104310, o qual foi considerado um excelente marcador de diagnóstico (AUC=1,000). De seguida, a capacidade de prever o outcome do paciente em termos de sobrevida em geral e sobrevida livre de progressão, através dos valores de metilação e expressão dos genes e locais de metilação específicos para cada um dos estádios, foi avaliada. Em relação à sobrevivência em geral, para os estádios II, III e IV, foram identificados 6, 1 e 5 genes e 87, 7 e 3 locais de metilação, respetivamente, como possíveis biomarcadores de prognóstico (p-value < 0.05). Especificamente, genes como o ZNF536 (p-value=0,018; HR=3,133), SOX1 (p-value=0,041; HR=0.459) e BFSP2 (p-value=0,027; HR=2.828), por exemplo, foram identificados como bons preditores de sobrevivência em geral dos estádios II, III e IV, respetivamente. Relativamente aos locais de metilação, as cg02430935 localizada no gene HMX (p-value=0,013; HR=3,139), cg26489108 localizada no gene DMRT3 (p-value=0,027; HR=0,407) e a cg01847754 localizada no gene CXorf1 (p-value=0,019; HR=3,155), por exemplo, foram identificadas como bons marcadores para a sobrevivência em geral dos estádios II, III e IV, respetivamente. Quanto à sobrevivência livre de recorrência, para os estádios II, III e IV, foram identificados 3, 3 e 2 genes e 30, 12 e 9 locais de metilação, respetivamente, capazes de prever se o doente para recorrer ou não. Mais concretamente, genes como o CNTD2 (p-value=0,00033; HR=0,196), SOX1 (p-value=0.01; HR=0,359) e HTR2C (p-value=0,0064; HR=0,285) foram identificados como bons preditores de prognóstico para a sobrevivência livre de progressão nos estádios II, III e IV, respetivamente. Relativamente aos locais de metilação, as cg06162589 localizada no gene SLC5A8 (p-value=0.0066; HR=0,2924), cg03700449 localizada no gene ASCL1 (p-value=0.0055; HR=0,3114) e cg14772660 localizada no gene SLC5A7 (p-value=0.0047; HR=4,3174) são exemplos de bons preditores de sobrevivência livre de progressão para os estádios II, III e IV, respetivamente. Conclusão: Este estudo sugere que as alterações epigenéticas são dinâmicas ao longo da progressão de cancro colorretal, demonstrando que há alterações que são características de estádios específicos, enquanto outras se mantêm alteradas desde o primeiro estadio. Notavelmente, algumas das alterações conseguem distinguir doentes com um prognóstico mais severo de doentes com um prognóstico mais indolente. Assim sendo, este estudo mostrou que existem possíveis biomarcadores para cancro colorretal que devem ser melhor estudados no futuro. Este estudo pode ainda demarcar o início da melhoria das técnicas de diagnóstico e prognóstico

    Similar works