Tese de mestrado. Biologia (Biologia Evolutiva e do Desenvolvimento). Universidade de Lisboa, Faculdade de Ciências, 2013Gene duplication facilitates the evolution of new gene functions by relaxing evolutionary pressure on the duplicates. Besides pseudogenization, three outcomes can occur: both copies keep the ancestral function (e.g., Positive dosage); one maintains the ancestral function and the other gains a new function (Neofunctionalization); ancestral functions are partitioned between the copies (Subfunctionalization). Cis-regulatory evolution, mainly enhancers, has gained weight in explaining this process, due to its lesser pleiotropic nature relative to protein evolution. However, knowledge on the cis-regulatory changes responsible for duplicate functional diversification is still lacking. In our lab, we use clusters III and V of the Ly6 gene family of Drosophila melanogaster, which underwent sequential duplications during the dipteran evolution, as a gene duplication evolutionary model. At each duplication event, one of the duplicates maintained the ancestral expression pattern while the other acquired novel expression domains (Neofunctionalization). CG9336 and CG9338, found in D. melanogaster, are the most recent duplicates, having already divergent expression patterns. An interesting fact is that expression divergence is not only seen between these duplicates and the unduplicated orthologue found in Ceratitis capitata, but also between duplicates in different species of Drosophilids. Given the high frequency of duplication events within a short time-scale observed in these genes, they are a good model to study cis-regulatory evolution. In this study, I focus on the most recent duplication, D. melanogaster CG9336 and CG9338, to examine the genomic location of the enhancers responsible for the expression pattern divergence observed. Intergenic and Intronic sequences of these genes were tested on a Gal4 reporter vector for enhancer activity. All regions tested showed enhancer activity and were able to recapitulate most of the duplicates expression patterns, both new and conserved. Sequence conservation analysis was also performed for the three Drosophilid species that showed expression pattern divergence.A duplicação de genes é um processo molecular que facilita a evolução de novos genes com novas funções. Isto acontece porque a presença de uma segunda cópia relaxa a pressão selectiva sobre estes genes, permintindo que se acumulem mutações nestes. A pseudogenização de uma das cópias é o destino mais provável após um evento de duplicação, assumindo que a fixação dá-se através de selecção neutral (o que é normalmente assumido), mas outros resultados podem ocorrer: ambas as cópias podem manter a função ancestral (e.g., dosagem positiva ou robustez genética); uma cópia mantém a função ancestral enquanto a outra evolui adquirindo uma nova função (modelo de neofuncionalização); ou as funções ancestrais podem ser repartidas por ambas as cópias (modelo de subfuncionalização). Existem vários exemplos que ligam divergência fenotípica à origem de novos genes através de duplicação génica, mas os processos evolutivos por detrás deste tipo de evolução ainda não são inteiramente percebidos. A evolução cis-regulatória, principalmente a evolução de enhancers (uma sequência de DNA não codificante que possui locais de ligação a factores de transcrição, induzindo a expressão do gene a que está associada), tem ganho importância em explicar o processo por detrás da evolução de genes duplicados, devido ao facto de que modificações na sequência codificante de um gene são de uma natureza pleitrópica maior quando comparadas com modificações em sequências regulatórias (i.e., têm uma probabilidade maior de afectarem a função do gene, pois podem modificar a proteína codificada por este gene, do que modificações num enhancer, que só afecta parte da expressão do gene). Os enhancers podem sofrer vários tipos de modificações que podem causar mudanças de expressão no gene regulado. Eles próprios podem acumular mutações, o que por sua vez pode causar 1) a perda desse mesmo enhancer, sendo perdida a expressão do gene por ele regulada, ou 2) a modificação dos locais de ligação a factores de transcrição, mudando o seu domínio de expressão ou criando um novo para além do já existente. Modificações na localização de um enhancer podem também causar mudanças na expressão do gene por ele regulada. Assim, os padrões de expressão de duas cópias de um gene podem ser mudados através da modificação de enhancers, de modo a que estes sejam expressos em tecidos diferentes, deixando assim de ser redundantes e podendo evoluir novas funções ou dividir as funções ancestrais. Existem vários trabalhos que ligam mudanças cis-regulatórias à evolução de novas funções, mas os mecanismos evolutivos pelos quais estas novas funções foram adquiridas estão pouco estudados e fracamente compreendidos. No nosso laboratório, é usado como modelo de evolução da duplicação de genes os clusters III e V da família de genes Ly6 de Drosophila melanogaster, os quais sofreram duplicações sequenciais durante a evolução dos Dípteros. Os clusters são compostos por 9 genes, dos quais 8 surgiram através de sucessivas duplicações. O padrão de expressão ancestral é mantido por uma das cópias em cada evento de duplicação, enquanto a outra cópia diverge e evolui novos padrões de expressão. Os genes CG9336 e CG9338 do cluster V de D. melanogaster resultam da duplicação mais recente, a qual se deu após a separação entre os Tephritidae e os Drosophilidae. Um ortólogo do gene ancestral pode ser encontrado na espécie Ceratitis capitata. O padrão de expressão ancestral, caracterizado pela expressão no sistema nervoso e epiderme do embrião, é mantido quase únicamente pelo gene CG9336, enquanto que o gene CG9338 possui uma nova expressão nos hemócitos. No entanto, a expressão na epiderme parece ter sido quase perdida e um novo domínio de expressão é visível no tubo cardíaco do embrião no gene CG9336. Outro facto interessante é a fraca expressão do gene CG9338 no sistema nervoso. O padrão de expressão destes genes diverge também entre diferentes espécies de Drosophilídios, nomeadamente as expressões na epiderme e no tubo cardíaco. A expressão na epiderme parece ser gradualmente perdida e a expressão no tubo cardíaco parece ser gradualmente ganha. No entanto, existem domínios de expressão que parecem manter-se conservados durante a evolução destes genes (e.g., expressão no sistema nervoso), o que suscita a ideia de conservação de enhancers. A divergência observada nestes genes deu-se numa pequena escala de tempo, tornando estes genes um bom modelo para estudar a evolução cisregulatória e a sua influência na evolução de genes duplicados. Neste estudo, eu foco-me na duplicação mais recente, os genes CG9336 e CG9338 de D. melanogaster, com o objectivo de examinar a localização genómica dos enhancers responsáveis pela divergência de padrões de expressão observada. Para este efeito, eu isolei, clonei, e sequenciei para verificação de erros produzidas por PCR, as sequências dos intrões e das regiões intergénicas 5’ e 3’ dos genes CG9336 e CG9338, usando-os para construir vectores repórter Gal4 para testar se estes possuem actividade de enhancers. Estes vectores foram depois transformados em D. melanogaster, adquirindo linhas transformantes para cada uma destas regiões e cruzando-as com uma linha UAS-GFP para verificar a expressão do gene repórter. Análise de conservação de sequência, possível através da ferramenta bioinformática mVista, foi feita para as três espécies de Drosophilídios (D. ananassae, D. melanogaster e D. virilis) com padrões de expressão divergentes, para verificar se existem padrões de expressão que possam ser relacionados com os resultados adquiridos com os gene repórter, e se existem mudanças nestes padrões entre estas espécies que possam explicar as diferenças observadas, pois é esperado que as sequências de enhancers sejam mais conservadas do que outras sequências não-codificantes. Todas as regiões testadas mostraram actividade de enhancer, sendo capazes de recriar quase todos os domínios de expressão dos genes estudados, tanto os novos como os conservados. Regiões que regulam expressão na epiderme, no sistema nervoso, no tubo cardíaco e nos hemócitos foram encontradas. Ainda mais, picos de conservação resultantes da análise em mVista desta região genómica são encontrados em cada uma destas regiões, possívelmente representando os enhancers aqui encontrados. Diferenças na conservação destes picos entre espécies suscitam modificações na sequência destes enhancers, significando que estes sofreram mudanças durante a evolução destes genes. Estas mudanças podem ser explicativas da forma como os padrões de expressão divergiram. Parece existir um padrão de duplicação, seguida de modificação de enhancers, a qual pode explicar como estes genes foram mantidos em termos de evolução de genes duplicados. Porém, a evolução dos módulas cisregulatórios destes genes parece longe de ser linear, sendo mais complexa do que era esperado, e os dados deste trabalho não são suficientes por si só para explicar a extensão das modificações por detrás da divergencia observada, pois apenas nos dão informações sobre um único estado evolutivo. Para uma melhor compreensão da evolução cis-regulatória por detrás das mudanças de expressão observadas nestes genes entre Drosophilídeos e o gene encontrado em C. capitata, o tipo de estudo aqui feito deve ser estendido às outras espécies que apresentam diferenças nos padrões de expressão destes genes. Progressos nesta direcção foram já feitos por mim, através do isolamento e clonagem de algumas destas regiões noutras espécies de Drosophilídeos que serão utilizadas para criar mais genes repórter para testar a capacidade destas regiões de activar expressão. Estes resultados serão depois comparados com os resultados deste trabalho para elucidar com é que os enhancers responsáveis pelos vários domínios de expressão dos genes duplicados evoluíram para dar origem às diferenças de expressão observadas