Uncovering differential DNA methylation alterations in subtypes of Acute Myeloid Leukemia

Abstract

Acute myeloid leukemia (AML) is a hematological malignancy where the hematopoietic stem cells or progenitor cells accumulate epigenetic and genetic alterations, losing their differentiation ability and gain proliferative advantage. AML is classified based on the cytogenetic abnormalities detected in the patient’s leukemic cells. The World Health Organization (WHO) classification system is the most used and more current, distinguishing six subgroups. Moreover, the French-American-British (FAB) classification system also classifies AML, distinguishing seven subtypes (M0, M1, M2, M4, M5, M6, M7). The cytogenetic abnormalities and mutations in specific genes also allow the AML stratification into three prognostic risk groups: favorable, intermediate, and adverse. However, not all AML patients’ leukemic cells exhibit chromosomal arrangements or gene mutations with prognostic impact, being categorized in the intermediate prognostic risk group. These patients show high clinical heterogeneity, being the treatment decision a current problem. Our goal was to identify potential prognostic biomarkers of gene expression and DNA methylation that could predict survival in AML patients that were categorized in the intermediate prognostic risk group. Thus, we developed an R-based algorithm that evaluates the prognostic potential of each gene and CpG site, available on the TCGA LAML cohort, in AML patients classified as FAB M1, M2, M4, and M5 subtypes. The algorithm was also performed in a group of patients with AML classified as FAB M0, M1, M2, M4 and M5 together. Our results suggest that there are some genes whose expression and/or DNA methylation are able to subdivide the AML patients categorized in the intermediate prognostic risk group into two subgroups with distinct overall survival. In conclusion, although the patients categorized in the intermediate prognostic risk group show a heterogeneous prognosis, they can be segregated by some candidate prognostic biomarkers of gene expression and DNA methylation, which can help to decide the best therapy for them.A leucemia mielóide aguda (LMA) é um grupo de cancros hematológicos heterogéneos que resultam da transformação de células estaminais hematopoiéticas ou progenitoras através da acumulação de alterações epigenéticas e genéticas, que conferem uma maior capacidade proliferativa e bloqueiam a sua diferenciação em células sanguíneas mais especializadas e funcionais. Por sua vez, as células transformadas (células leucémicas) acumulam-se na medula óssea e sangue periférico conduzindo a falhas ao nível da medula óssea e da hematopoiese. Quanto à epidemiologia da doença, a LMA é o tipo de leucemia mais frequente em adultos e pode ser desenvolvida em indivíduos de todos os grupos etários. Contudo, a doença é mais frequente em indivíduos mais velhos com uma idade média de diagnóstico aos 68 anos, sendo a idade aumentada o principal factor de risco da doença. A LMA é diagnosticada pela presença de pelo menos 20% de blastos miéloides na medula óssea ou através da deteção de alterações citogenéticas ou moleculares que já foram associadas com o desenvolvimento da doença. Estas alterações incluem: a t(8;21) (RUNX1-RUNX1T1), inv(16) ou t(16;16) (CBFB-MYH11) e a t(15;17) (PML-RARA), que caracteriza a leucemia promielócitica aguda. Além disso, as alterações citogenéticas e moleculares detetadas nas células leucémicas dos pacientes e usadas para diagnosticar a LMA permitem também a classificação da doença. O sistema de classificação proposto pela Organização Mundial da Saúde é atualmente usado para classificar a LMA, permitindo distinguir seis subtipos de leucemia: (1) LMA com alterações citogenéticas recurrentes, (2) LMA com alterações relacionadas com mielodisplasia, (3) LMA relacionada com terapia, (4) LMA não especificada, (5) sarcoma mieloide, e (6) proliferação mielóide de síndrome de Down. Relativamente aos casos de LMA do subtipo não especificado, a LMA é ainda classficada através do French-American-British (FAB) classification system que distingue sete subtipos (M0, M1, M2, M4, M5, M6, e M7) de LMA, com base na morfologia e características citoquímicas das células leucémicas. Após a identificação do subtipo de LMA, os pacientes são ainda estratificados em três grupos de prognóstico: favorável, intermédio e adverso. Esta estratificação é feita com base nas alterações citogenéticas e mutações génicas detetadas nas células leucémicas dos pacientes e apresenta um papel importante na escolha do melhor tipo de tratamento para o paciente. Por exemplo, a t(8;21) [RUNX1/RUNX1T1] permite a estratificação da doença no grupo de risco favorável. Por sua vez, a deteção de mutações no RUNX1 estratifica a doença no grupo de risco adverso. Contudo, a maioria dos casos de LMA são categorizados no grupo de risco intermédio, sendo este definido por LMA com cariótipo normal, t(9;11)(p22;q23) [MLLT3-MLL9] ou pela presença de anormalidades citogenéticas que não são incluídas nos grupos de risco favorável ou adverso. LMA com cariótipo normal, ou seja, quando as células leucémicas não apresentam alterações citogenéticas ou mutações com valor de prognóstico conhecido, representam a maioria dos casos de LMA categorizada como risco intermédio. Estes pacientes são ainda caracterizados por uma grande heterogeneidade clínica, o que dificulta a escolha do melhor tipo de tratamento. Assim, o objetivo do nosso estudo é identificar potenciais biomarcadores de prognóstico de expressão genética e metilação de DNA que sejam capazes de prever sobrevida em pacientes com prognóstico intermédio e sem alterações citogenéticas ou mutações com valor de prognóstico conhecido. Para tal, desenvolvemos um algoritmo que compreende quatro fases: preparação dos dados para análise, identificação dos primeiros candidatos para biomarcadores de prognóstico, calibração da idade como fator de confusão, e seleção restritiva dos candidatos finais. A metodologia desenvolvida faz uso de técnicas de inferência estatística para avaliar o potencial de prognóstico dos níveis de expressão de cada gene e metilação de DNA de cada CpG, disponíveis no The Cancer Genome Atlas (TCGA) Acute Myeloid Leukemia (LAML) cohort, em pacientes cuja LMA foi classificada nos subtipos FAB M1, M2, M4, e M5 e categorizada no grupo de risco intermédio com cariótipo normal. O algoritmo foi também aplicado a um grupo de pacientes com os subtipos FAB M0, M1, M2, M4 e M5 agrupados. Os nossos resultados sugerem que a expressão e/ou metilação de certos genes podem subdividir os pacientes com subtipos de LMA categorizados no grupo de risco intermédio estudados em dois subgrupos com sobrevidas distintas. Por exemplo, de acordo com os nossos resultados, os níveis de expressão do gene MCM4 são capazes de diferenciar sobrevida em pacientes com o subtipo FAB M1 categorizado no grupo de risco intermédio, sendo que os pacientes do subgrupo com pior prognóstico exibem baixos níveis de expressão do potencial biomarcador. No mesmo grupo de pacientes, a metilação do promotor do gene SCIN é um exemplo de um potencial biomarcador de prognóstico de metilação de DNA, sendo a metilação do mesmo no promotor relacionada com pior prognóstico nos grupo de pacientes estudados. Comparando os biomarcadores identificados nos grupos de pacientes com FAB M1, M2, M4 e M4 categorizados no grupo de risco intermédio, o algoritmo identificou maior número de biomarcadores candidatos de expressão genética e de metilação de DNA no grupo de pacientes com o subtipo FAB M2. Existem potenciais biomarcadores identificados cujo o seu valor de prognóstico já foi documentado em pacientes diagnosticados com AML, como por exemplo o gene ABCB1 como biomarcador de prognóstico de expressão, e o gene DLX4 como biomarcador candidato de metlação de DNA em pacientes do subtipo FAB M2 estudados. Além disso, com base nas subdivisões geradas por cada potencial biomarcador de expressão genética identificado, averiguámos se os subgrupos de pacientes com pior prognóstico identificados compartilham alterações na regulação de conjuntos de genes relacionados com processos biológicos em comparação com os subgrupos de pacientes com melhor prognóstico. Verificámos que, apesar de a maioria dos potenciais biomarcadores de prognóstico identificados distribuírem os pacientes de forma distinta, a maioria dos subgrupos com pior prognóstico parecem compartilhar sobreregulações e subregulações de conjuntos de genes relacionados com processos biológicos distintos. Por exemplo, as células leucémicas da maioria dos pacientes dos subgrupos de pior prognóstico com o subtipo FAB M1 categorizado no grupo de risco intermédio, parecem subregular conjuntos de genes que estão relacionados com o processo de catabolismo do peróxido de hidrogénio quando comparados com os subgrupos de melhor prognóstico do mesmo subtipo de LMA. Estes processos biológicos poderão estar a influenciar o prognóstico dos pacientes com LMA. Em conclusão, apesar de pacientes com células leucémicas sem rearranjos cromossomais ou mutações génicas com valor de prognóstico conhecido serem categorizados no mesmo subgrupo de risco, estes pacientes podem apresentar diferentes prognósticos que podem ser previstos através de potenciais biomarcadores de expressão e/ou metilação de DNA. Esta subdivisão poderá ajudar na decisão de um melhor tipo de tratamento para pacientes nas condições estudada

    Similar works