Caracterização das sequências regulatórias de poliadenilação e modulação da expressão por micrornas em um conjunto abrangente de genes de predisposição ao câncer

Abstract

A poliadenilação consiste na etapa de processamento da extremidade 3’ dos pré-mRNAs em eucariotos. Duas sequências regulatórias localizadas na região 3’ não-traduzida (3’UTR) desses transcritos primários apresentam um papel fundamental nesse processo: o sinal de poliadenilação (SP) AAUAAA e suas variantes funcionais; e o sítio de clivagem (SC), preferencialmente um dinucleotídeo “CA”. Outros elementos de sequência também situados na região 3’UTR são os sítios de ligação para microRNAs (miRNAs), os quais representam uma classe de pequenos RNAs não-codificantes que regulam negativamente a expressão gênica e podem atuar como supressores de tumor e/ou oncogenes. Os principais objetivos desse estudo foram: (1) caracterizar os SP e SC em um conjunto de genes de predisposição ao câncer (GPC); (2) avaliar a frequência de poliadenilação alternativa entre os GPC estudados; e (3) identificar miRNAs e/ou famílias de miRNAs potencialmente oncogênicos e supressores de tumor considerando o mesmo grupo de genes. Para caracterizar essas sequências nos GPC selecionados (n=117) foram utilizados os bancos de dados do NCBI (referência) e os bancos de dados de poliadenilação alternativa APADB e APASdb. A busca por miRNAs reguladores de genes supressores de tumor (n=81) e oncogenes (n=17) foi realizada utilizando fontes de dados preditos computacionalmente e com validação experimental. Em relação ao objetivo (1), 21 dos 117 GPC (~18%) não apresentaram SP indicados no NCBI, sendo que um método computacional foi empregado para detectar SP putativos nesses genes. A maioria dos SP descritos para GPC nesse banco (74,4%) possuía a sequência canônica AAUAAA, enquanto 24,1% continha a variante funcional AUUAAA. Curiosamente, o dinucleotídeo “AA” representou o SC mais frequente dentre os GPC analisados. Além disso, análises relacionadas ao objetivo (2) identificaram evidências de poliadenilação alternativa (mais de um SP funcional) em 105 GPC (~90%), em comparação com uma estimativa anterior de que isso ocorreria em cerca de 50% dos genes humanos, sugerindo uma maior complexidade na regulação da poliadenilação nesses transcritos. Quanto ao objetivo (3), a família de miRNA miR-192 foi significativamente super-representada entre os genes supressores de tumor (P<0,01), o que sugere 10 uma função potencialmente oncogênica. Em contraste, um número maior de famílias de miRNAs foi fortemente associado com a regulação de oncogenes: miR-128, miR-1471, miR-483, miR-3170 e miR-218. Nossos dados fornecem um mapeamento das sequências regulatórias de poliadenilação (SRP) em GPC, o qual pode ser utilizado no desenvolvimento de análises moleculares incluindo esses elementos da região 3’UTR frequentemente negligenciados na rotina de diagnóstico molecular. Ademais, estudos funcionais devem ser realizados para validar as funções potencialmente atribuídas às famílias de miRNAs aqui mencionadas. Em suma, esse é o primeiro estudo focado nesse tipo de caracterização abrangente (SRP e miRNAs) em GPC.Polyadenylation is the processing step of 3’end in eukaryotic pre-mRNAs. Two regulatory sequences located in the 3’ untranslated region (3’UTR) of these primary transcripts play an essential role in this process: the polyadenylation signal (PAS) AAUAAA and its functional variants; and the cleavage site (CS), preferentially a “CA” dinucleotide. Other 3’UTR sequence elements are the binding sites for microRNAs (miRNAs), which represent a class of small non-coding RNAs that negatively regulate gene expression, and can act as tumor suppressors and/or oncogenes. The main goals of this study were: (1) to characterize PAS and CS in a set of cancer predisposition genes (CPGs); (2) assess the frequency of alternative polyadenylation among the studied genes; and (3) identify potentially oncogenic and tumor-suppressive miRNAs or miRNA families considering the same group of genes. In order to characterize these sequences in the selected CPGs (n=117) the NCBI database (reference source) and the alternative polyadenylation databases APADB and APASdb were used. The search for miRNAs that regulate tumor suppressor genes (n=81) and oncogenes (n=17) was performed using computationally predicted and experimentally validated data sources. In relation to the first aim, 21 of the 117 CPGs (~18%) did not exhibited a PAS sequence indicated in NCBI, and a computational method was employed to detect putative PAS in these genes. In this database, most described PAS (74.4%) for CPGs had the canonical sequence AAUAAA, while 24.1% contained the functional variant PAS AUUAAA. Interestingly, “AA” dinucleotide was the most frequent CS associated with the CPGs. In addition, second aim related-analyses identified alternative polyadenylation evidences (more than one functional PAS) for 105 CPGs (~90%), while a previous estimate indicated that it occurs in about 50% of human genes, suggesting a greater complexity in the regulation of polyadenylation in these transcripts. Regarding the third aim, miR-192 family was significantly overrepresented among tumor suppressor genes (P<0.01), which suggests a potentially oncogenic function. In contrast, a larger number of miRNA families was strongly associated with regulation of oncogenes: miR-128, miR-1471, miR-483, miR-3170 and miR-218. Our data provide a mapping of polyadenylation regulatory sequences (PRS) in CPGs, which can be used in the 12 development of molecular analyses including these 3'UTR elements often neglected during the routine molecular diagnosis. Furthermore, functional studies should be performed to validate the potential functions assigned to the miRNA families mentioned herein. In summary, this is the first study focused on this type of comprehensive characterization (PRS and miRNAs) in CPG

    Similar works