The role of miRNA-mediated cis-regulation in breast cancer susceptibility

Abstract

Cis-regulation of gene expression is believed to be central in breast cancer (BC) predisposition. Here we aimed to unravel the contribution of allele-specific miRNA regulation to BC risk. We screened the effect of 223 published BC genome wide association studies (GWAS) -significant single nucleotide polymorphisms (SNPs) (and their 2668 unique proxies in high linkage disequilibrium) on differential miRNA-regulation. We filtered these SNPs based on location in miRNA genes and/or messenger RNA (mRNA) of protein-coding genes. Selected SNPs were then evaluated for putative differential miRNA-binding using TargetScan and miRanda, two distinct miRNA-target prediction algorithms, modified to analyse sequences carrying SNP alleles. Results were filtered for miRNAs with evidence of expression in breast tissue, and for genes displaying differential allelic expression (DAE), a hallmark of cis-regulation. To validate our findings, we prioritized the candidate SNPs for functional characterization, by combining TargetScan’ and miRanda’ predictions. Interestingly, none of the SNPs mapped to miRNA genes, thus suggesting that miRNA biogenesis and target-binding alteration, via seed sequence modification, are mechanisms unlikely to be involved in BC risk. Of the SNPs located in mRNA sequences we found 93 out of 3891 that were predicted to alter the miRNA-mRNA binding in 27 BC-associated risk loci. From our predictions, we found rs4245739 in MDM4 and rs11540855 in ABHD8, already functionally validated by others to cause allele-specific miRNA-binding. We carried in vitro functional characterization of rs6884232 in ATG10, one of the best candidates identified by both TargetScan and miRanda algorithms. The predicted specific binding of hsa-miR-21-3p to the G allele of this SNP was evaluated using a dual-luciferase system, with constructs carrying either the A or the G allele, and in combination with miRNA mimics and inhibitors in a breast adenocarcinoma cell line. However, no allele-specific specific differences in luciferase activity were observed. To our knowledge, this is the first study looking into the global role of miRNA regulation in BC risk, further improved by the integration of DAE data from normal breast samples.A cis-regulação é um dos mecanismos pelo qual a expressão génica é maioritariamente controlada. Para além disso, postula-se que a cis-regulação tenha um papel fundamental para o risco de doenças complexas, onde se inclui o cancro da mama. Sendo o cancro da mama o tipo de cancro mais comum entre mulheres a nível mundial, o benefício em identificar marcadores de risco e de os usar na clínica, para a identificação precoce da população em risco, é indiscutível. Nos últimos dez anos, estudos de associação genómica (do inglês genome-wide association studies, GWAS) têm vindo a identificar um largo número de variantes genéticas comuns que conferem baixos níveis de risco para cancro da mama. Estas variantes são polimorfismos de nucleótido único (SNPs) e estão maioritariamente localizadas em regiões não codificantes, o que sugere que estas poderão conferir risco através da regulação dos níveis de expressão génica. Dos estudos funcionais já efetuados para algumas destas variantes de risco, confirmou-se que estas são cis-reguladoras e que conferem risco para cancro da mama através da ligação diferencial de fatores de transcrição. No entanto, existem muitos outros mecanismos biológicos de cis-regulação para além da ligação de fatores de transcrição, tais como a regulação pós-transcricional por microARNs (miARNs) ou alteração do processamento do ARN. Particularmente, os miARNs são pequenas moléculas de ARN de cadeia simples, capazes de induzirem o silenciamento de genes alvo ao se ligarem por complementaridade, principalmente, à região 3’ não traduzida (UTR) do ARN mensageiro. Os miARNs podem também levar ao silenciamento de genes ao ligar-se à sua sequência codificante (CDS) ou 5’UTR. Cis-regulação via miARNs pode ser afectada por SNPs localizados em genes codificantes para miARNs, afetando a sua biogénese ou alterando os seus genes alvo (através da alteração da sequência de ligação dos miARNs), ou podem estar localizadas nos genes alvo, alterando a estabilidade de ligação dos miARNs. A presente dissertação de mestrado teve como objetivo desvendar a contribuição de variantes genéticas cis-reguladoras que afetam a regulação de miARNs para o risco de cancro da mama. Como tal, investigou-se o efeito de 223 SNPs, identificados por GWAS para risco para cancro da mama, na regulação diferencial por miARNs. Da mesma forma, também se avaliou o efeito de SNPs que se encontravam em elevado desequilíbrio de ligação com estes, ou seja em estrita ligação genética. Primeiro, filtrou-se estes SNPs pela sua localização em genes de miARNs e/ou 5’UTR, CDS e 3’UTRs de genes codificantes para proteínas. Posteriormente, avaliou-se o potencial dos SNPs selecionados para alterarem a ligação de miARNs. Uma vez que não se encontravam disponíveis ferramentas que o efetuassem, procedeu-se à modificação de dois algoritmos de previsão de ligação de miARNs já existentes, TargetScan e miRanda, para que estes permitissem a análise dos diferentes alelos de SNPs. Estes algoritmos foram selecionados não só pela sua metodologia, como também pela sua capacidade de serem aplicados em R, um ambiente de programação de livre-acesso para computação estatística e gráfica. Deste modo, foi possível não só modificação dos algoritmos para analisarem sequências contendo alelos de SNPs, como também foi possível a sistematização do processo. De seguida, efetuou-se um filtro para miARNs expressos em tecido mamário, por estes possuírem expressão específica de tecidos. Para além disso, filtraram-se os resultados por genes que possuíssem expressão alélica diferencial (DAE), uma característica da cis-regulação, em tecido mamário normal. De modo a validar as nossas descobertas, procedeu-se à priorização dos SNPs candidatos para validação funcional. Para isso, combinaram-se as previsões efetuadas tanto pelo TargetScan como pelo miRanda, de modo a aumentar a probabilidade de selecionar um SNP que tivesse um efeito real. Curiosamente, nenhum dos SNPs associados com risco para cancro da mama se encontrava em genes de miARNs. Isto sugere que tanto a alteração da biogénese de miARNs, como a alteração dos genes alvo por modificação da sequência de ligação dos miARNs, são mecanismos improváveis de estarem a contribuir para o risco para cancro da mama. Dos SNPs localizados em genes codificantes para proteínas, encontraram-se 93 (dos 3891 SNPs iniciais) previstos de estarem a afetar a ligação de miARNs em 27 loci associados com risco para cancro da mama. Isto sugere que cerca de um quarto dos loci já associados com risco para cancro da mama podem ser explicados pela regulação diferencial por miARNs. Destes SNPs, dois já se encontram validados funcionalmente noutros estudos, como estando a causar a ligação específica de miARNs para diferentes alelos: rs4245739 no gene MDM4 e rs11540855 no gene ABHD8. Isto valida a nossa análise e sugere que outras das previsões efetuadas também poderão ser funcionais. Finalmente, a priorização dos SNPs de risco, associados com cancro da mama, efetuada através da combinação das previsões obtidas tanto pelo TargetScan, como pelo miRanda, resultou na identificação de seis candidatos com maior probabilidade de estarem a afetar a ligação de miARNs: rs1573 (localizado no gene ASB13), rs2385088 (localizado no gene ISYNA1), rs1019806 e rs6884232 (localizados no gene ATG10), rs4808616 (localizado no gene ABHD8), e ainda rs3734805 (localizado no gene CCDC170). De seguida, procedeu-se à caracterização funcional in vitro do rs6884232 localizado no gene ATG10. Para este SNP, previu-se a ligação específica do hsa-miR-21-3p ao alelo G (context++ score = -0.169), o que resultaria na diminuição da expressão deste gene. Primeiro, efetuou-se um ensaio de luciferase em células de adenocarcinoma mamário (MCF-7) usando plasmídeos com genes repórter de luciferase contendo, ou o alelo A, ou o alelo G do SNP. No entanto, não foram observadas diferenças na atividade da luciferase entre ambos os alelos. De seguida repetiu-se o ensaio, desta vez em combinação com mímicos e inibidores do hsa-miR-21-3p e ainda com os seus respetivos controlos negativos. Mais uma vez, não se obteviveram diferenças na atividade da luciferase entre ambos os alelos, sugerindo que este SNP não causa a ligação diferencial do hsa-miR-21-3p aos seus alelos. Porém, a elevada variabilidade obtida entre replicados biológicos, assim como efeitos não esperados em condições controlo, não nos permite ainda retirar conclusões definitivas, sendo necessário repetir o ensaio. Tanto quanto se sabe, o presente trabalho é o primeiro estudo a avaliar o papel global da regulação por miARNs no risco para cancro da mama e que engloba dados de DAE em tecido mamário normal. No futuro, esperamos complementar esta abordagem ao determinar e caracterizar a importância clínica do efeito de variantes genéticas cis-reguladoras mediadas por miARNs em cancro da mama. Isto permitirá melhorar a caracterização dos loci já associados com risco para cancro da mama e ainda melhorar o conhecimento da etiologia do cancro da mama

    Similar works