Assessing adaptive genetic variation in cork oak expressed genes

Abstract

Tese de mestrado. Biologia (Biologia Evolutiva e do Desenvolvimento). Universidade de Lisboa, Faculdade de Ciências,O sobreiro (Quercus suber L.) é uma árvore de folha perene endémica do Oeste da Bacia do Mediterrâneo. A sua área de distribuição natural estende-se desde a costa atlântica da Península Ibérica e de Marrocos até ao Sudeste da Península Itálica, sendo em Portugal que se encontram os maiores povoamentos de sobreiro. É possível também encontrar esta espécie na Bulgária, como resultado de introdução humana. O sobreiro caracteriza-se principalmente pela cortiça que produz, continuamente e de forma renovável, a qual protege a árvore de factores externos agressivos, tais como o fogo. A cortiça tem propriedades físico-químicas únicas que lhe conferem um elevado valor comercial, contribuindo de modo significativo para a economia dos países onde o sobreiro se encontra naturalmente distribuído e onde é comercialmente cultivado e explorado. Portugal é o maior produtor mundial de cortiça, tendo por isso o sobreiro um grande valor económico e social a nível nacional. Do ponto de vista ecológico, detém também uma grande importância, uma vez que o montado de sobro (ou dehesa em Espanha) constitui um sistema de características únicas, essencial para a sobrevivência de um grande número de espécies nativas de plantas e animais e para a prevenção da desertificação. Dada a sua grande relevância nestes vários aspectos, o sobreiro foi considerado recentemente “Árvore Nacional de Portugal”, o que expressa a sua enorme importância cultural e patrimonial para o país. Os povoamentos de sobreiro têm vindo a sofrer um declínio devido à falta de regeneração natural, atribuída essencialmente a períodos de seca intensa, à dependência de árvores adultas envelhecidas e à má gestão do montado. Para além disso, estão previstas para este século grandes alterações climáticas, com especial impacto na Bacia Mediterrânica, que podem vir a aumentar a pressão sobre as populações de sobreiro. Nesta região, espera-se um grande aumento das temperaturas e períodos de seca mais severos e prolongados. Prevê-se que estas alterações ocorram numa escala temporal tão curta que as espécies florestais, incluindo o sobreiro, poderão não conseguir acompanhá-las. O declínio do sobreiro tem sido também associado a várias pragas e doenças, principalmente à doença da tinta, provocada pelo fungo Phytophthora cinnamomi. Deste modo, é essencial e premente estudar a variabilidade genética do sobreiro, de modo a compreender a sua capacidade adaptativa a factores bióticos e abióticos, tendo em vista o delineamento de estratégias de gestão e conservação dos recursos genéticos desta espécie. Assim, o estudo da variabilidade genética adaptativa do sobreiro constitui o principal objectivo deste trabalho. Num estudo prévio, foi sequenciado o transcriptoma de folhas de sobreiro através da tecnologia de pirosequenciação 454, o qual foi subsequentemente analisado para detectar single nucleotide polymorphisms (SNPs). Mais de 400 SNPs putativos foram encontrados em regiões transcritas do genoma, os quais podem ser de grande interesse, uma vez que permitem obter informação sobre mutações em genes funcionais, possivelmente sob selecção. No entanto, as sequências obtidas por 454 podem conter erros e, para poder explorar os SNPs detectados, é importante proceder primeiro à sua validação para confirmar se esta variação corresponde a polimorfismos reais ou se, por outro lado, resulta de artefactos da tecnologia 454. O primeiro objectivo deste trabalho consistiu assim na validação de 10 a 15 SNPs putativos, de forma a desenvolver marcadores moleculares úteis, possivelmente sob selecção. O segundo objectivo consistiu em analisar cinco dos SNPs validados, do ponto de vista filogeográfico e da genética populacional, compreendendo a realização de vários testes de neutralidade para detectar sinais de selecção. Por fim, teve-se como terceiro objectivo testar associações entre a variabilidade genética encontrada e variáveis ambientais potencialmente relevantes para a adaptação local do sobreiro. A combinação de vários testes de neutralidade e métodos de associação ambiental é importante para estudos de selecção e adaptação, uma vez que diferentes métodos estatísticos têm diferentes capacidades e sensibilidades na detecção de selecção natural. Tendo em conta estes objectivos, desenharam-se primers para amplificar fragmentos de ADN genómico contendo os SNPs putativos e subsequentemente validá-los através de sequenciação Sanger. As amostras utilizadas nesta fase foram as mesmas previamente usadas para a pirosequenciação do transcriptoma. Dos SNPs validados, cinco foram escolhidos para uma análise mais detalhada dos respectivos fragmentos. Em primeiro lugar, foram estimadas as relações entre os haplótipos detectados para cada fragmento através da construção de redes haplotípicas. Em seguida foram efectuadas análises de variância molecular (AMOVA) com o intuito de aferir a estruturação populacional. A variabilidade genética e haplotípica foram estimadas para cada fragmento e vários testes de neutralidade foram efectuados, nomeadamente o D de Tajima, o Fs de Fu e o teste baseado na comparação entre a taxa de mutações não-sinónimas por posições não-sinónimas (dN) e taxa de mutações sinónimas por posições sinónimas (dS) implementado pelo software PAML. Por fim, foram feitos testes de associação entre os dados genéticos e diversas variáveis ambientais através de regressões logísticas implementadas pelo software MatSAM. Em relação ao processo de validação dos SNPs putativos, foi possível amplificar e sequenciar 59% dos fragmentos testados (19 de 32), um valor superior ao descrito noutros estudos similares. Do conjunto de SNPs testados, 11 foram validados, três foram invalidados, e para os restantes cinco não foi possível sequenciar todas as amostras utilizadas na sequenciação do transcriptoma, pelo que, apesar de ainda não se ter encontrado variação, não é possível chegar a qualquer conclusão em relação à sua autenticidade. Assim, obteve-se uma percentagem de 79% de sucesso de validação, um valor não muito inferior ao reportado em trabalhos anteriores. Dos fragmentos validados, cinco foram escolhidos para subsequente análise. Esses fragmentos encontram-se nos potenciais genes ortólogos de Arabidopsis thaliana (L.) Heynh. RAN3, NPR1, PR1, ARF16 e HSP. Para nenhum dos fragmentos analisados foi detectada estruturação geográfica da variabilidade genética, o que pode estar relacionado com o facto de os sobreiros serem organismos longevos, submetidos a condições ambientais variáveis ao longo da sua vida, e terem uma dispersão de pólen pelo vento a longas distâncias, características que normalmente levam a uma baixa estruturação entre populações ao nível de marcadores nucleares. Em dois dos fragmentos analisados (NPR1 e ARF16) foram encontrados sinais de selecção balanceada, tendo sido estimados para ambos valores significativamente positivos de D de Tajima e de Fs de Fu. Ambos apresentam ainda padrões filogeográficos e de distribuição geográfica da variabilidade genética semelhantes, sem estruturação. O NPR1 é um gene envolvido na defesa contra agentes patogénicos, tais como P. cinnamomi. As mutações não-sinónimas e não-conservativas (cujo aminoácido mutado tem propriedades físico-químicas diferentes) detectadas neste fragmento encontram-se no domínio ankirin repeats (ANK), essencial na activação de factores de transcrição responsáveis pelo controlo de genes de defesa contra agentes patogénicos. Assim, estas mutações podem estar sob pressão selectiva exercida por este stresse biótico, sendo por isso mantidos os polimorfismos. Por outro lado, sinais de selecção balanceada foram encontrados num estudo prévio no mesmo domínio do NPR1 de A. thaliana, corroborando a hipótese deste gene se encontrar sob este tipo de selecção. Em relação ao ARF16, este gene codifica um factor de transcrição envolvido na diferenciação da coifa e foi identificado como gene candidato à resistência à seca em Quercus robur L. As mutações não-sinónimas e não-conservativas detectadas neste fragmento encontram-se no domínio da proteína responsável pela sua acção como factor de transcrição, podendo desta forma ter efeitos a nível da transcrição dos genes activados pela proteína ARF16. Assim, estas mutações podem estar sob pressão selectiva exercida por condições ambientais flutuantes ao longo da vida do sobreiro, mantendo o polimorfismo neste gene. No fragmento do gene HSP foi detectada uma posição com sinal de selecção positiva (análise com PAML). Na mesma posição, a frequência do aminoácido aspartato foi positivamente correlacionada com precipitação em Setembro e latitude através dos estudos de associação. As proteínas HSP encontram-se geralmente associadas a condições de stresse, sendo provável que esta esteja envolvida na resposta a stresse hídrico. Setembro é usualmente o primeiro mês após o período de seca mais intensa, pelo que a precipitação neste mês será provavelmente importante para as plantas recuperarem desse período. Deste modo, árvores detentoras de genótipos com aspartato na posição em questão parecem estar mal-adaptadas a períodos de seca prolongada. Neste estudo foram desenvolvidos marcadores moleculares úteis para compreender a variabilidade genética adaptativa do sobreiro, confirmando-se a utilidade da pirosequenciação do transcriptoma de organismos não-modelo para este fim. Além disso, com esses marcadores foi possível adquirir novos conhecimentos em relação à adaptação do sobreiro ao meio ambiente, o que é essencial para que se possa definir estratégias de gestão e conservação dos recursos genéticos desta espécie.Cork oak (Quercus suber L.) is an evergreen tree endemic to the Western Mediterranean region with great economical, social and ecological relevance. It has a particular importance in Portugal, where the largest stands can be found. Cork oak stands have been facing a significant decline by the lack of regeneration, mostly due to severe drought periods, the dependence on aged adult trees and bad management. In the context of the climate changes predicted for this century, drought periods are expected to be increasingly longer and more rigorous in the Mediterranean Basin, which can enhance this decline. Moreover, several diseases have also been associated with cork oak populations’ decay. In this scenario, evaluating how cork oak populations can cope with these threats is essential to delineate management and conservation strategies for this species. The main goal of this work was therefore to assess cork oak adaptive genetic variation. Putative SNPs detected in cork oak transcriptome were validated in order to develop useful variable markers in functional genes potentially under selection. Five fragments containing validated SNPs were further investigated through a population genetics approach. Several neutrality tests were performed as well as environmental association tests in order to find selection signatures. Different selection signals were detected in the analysed fragments. NPR1, a gene involved in plant defence against pathogens, and ARF16, a gene implicated in root cap cell differentiation and previously identified as a candidate gene for drought resistance, seemed to be under balancing selection. In HSP, a gene possibly involved in response to drought stress, one amino acid position was detected as possibly being under positive selection and associated with latitude and precipitation in September. Therefore, in this study, useful molecular markers for assessing cork oak adaptive genetic variation were developed, allowing for the first steps to be taken into gathering important information and insights on cork oak adaptation to biotic and abiotic environmental conditions

    Similar works