Analysis of RAD sequencing data from species of Mediterranean cicadas

Abstract

Tese de mestrado, Bioinformática e Biologia Computacional, Universidade de Lisboa, Faculdade de Ciências, 2019Compreender a divergência e especiação entre espécies próximas sempre foi um tema desafiador no âmbito da biologia evolutiva. Os marcadores de DNA citoplasmáticos, os quais muitas vezes são usados em investigações no contexto de marcadores moleculares, nem sempre deram resultados bem-sucedidos que conseguissem resolver as respetivas filogenias e outras questões. Nos últimos anos, com o surgimento da Nova Geração de Tecnologias de Sequenciação e técnicas associadas que tiram partido de uma reduzida representação do genoma, é agora possível responder a questões relacionadas com a divergência populações e especiação. Aqui retratamos o potencial de uma dessas técnicas – Restriction-site Associated DNA (RAD) Sequencing -, para contribuir para a resolução de algumas questões no âmbito da especiação de um grupo particular de insetos, as cigarras mediterrânicas do género Tettigettalna. A técnica RAD sequencing tira partido da Illumina, uma das Tecnologias da Nova Geração de Sequenciação, para gerar dados genómicos de zonas adjacentes a locais de corte de restrição por enzimas (RAD tags). Isto permite simultaneamente identificar e marcar milhares de SNPs espalhados por todo o genoma, de qualquer tamanho, em centenas de indivíduos e para organismos modelo ou não. Como a RAD-Seq é uma técnica de sequenciação de reduzida representação do genoma, é claro que o seu uso tem muitas mais vantagens em comparação com técnicas de sequenciação de todo o genoma. Isto permitiu que a RAD-Seq se tenha tornado a metodologia genómica mais usada para a descoberta de SNPs em estudos filogenéticos e de evolução de organismos não-modelo como é o caso das espécies de cicadas do género Tettigettalna. Este género constitui um complexo de espécies de cigarras intimamente relacionadas que divergiram recentemente. Elas são morfologicamente semelhantes o que as torna um desafiante grupo taxonómico. Adicionalmente, o canto de chamamento produzido pelos machos é a principal característica que permite a distinção entre as espécies. Na Península Ibérica, a diversidade das cigarras foi amplamente subestimada até à recente descrição e revisão taxonómica de nove espécies de cicadas de pequeno porte pertencentes ao género Tettigettalna: Tettigettalna mariae, Tettigettalna argentata, Tettigettalna aneabi, Tettigettalna josei, Tettigettalna defauti, Tettigettalna armandi, Tettigettalna helianthemi, Tettigettalna boulardi e Tettigettalna estrellae. Algumas das espécies mencionadas são restritas a Espanha, sendo que apenas uma delas, Tettigettalna estrellae, é restrita a Portugal. Tettigettalna argentata é a única que para além da Península Ibérica se estende para mais países Europeus. Alguns estudos focados nas espécies da zona do Mediterrâneo pertencentes a este género evidenciaram a ocorrência de simpatria entre algumas espécies de Tettigettalna do sudoeste da Península Ibérica. As populações de Tettigettalna argentata têm uma distribuição que faz com que por vezes se sobreponham com outras populações de outras espécies. No Algarve (Portugal), as populações de Tettigettalna mariae e Tettigettalna argentata podem ser encontradas em simpatria ou parapatria. Estas duas espécies são consideradas um complexo de espécies gémeas, sendo morfologicamente muito semelhantes e apenas se distinguindo pelo seu canto de chamamento. Trabalhos baseados na análise de sequências mitocondriais (COI) permitiram a separação de populações de Tettigettalna argentata em clade do norte e clade do Sul. Adicionalmente, este clade do Sul revelou não ser geneticamente distinto dos espécimenes de Tettigettalna mariae, com o qual partilha a maior parte dos haplótipos. Assim, é muitas vezes impossível discriminar os espécimenes de T. mariae dos espécimenes de T. argentata (clade do Sul) com base apenas na análise de sequências COI. Como referido, as espécies de Tettigettalna podem ser distinguidas através dos sons produzidos pelos machos, pelo que se pensa que estes sinais acústicos possam ter um papel preponderante no isolamento reprodutivo das espécies. Na verdade, estudos baseados em dados de acústica revelam que diferentes espécies têm diferentes padrões acústicos. Porém, outros trabalhos com dados genéticos não esclarecem várias questões. Nomeadamente, se a partilha de haplótipos entre o clade Sul de Tettigettalna argentata e as Tettigettalna mariae será devida a introgressão (existência de fluxo genético entre populações) ou “Incomplete Lineage Sorting”, (segregação imperfeita de alelos em linhagens bem definidas). Os trabalhos realizados apontam assim para a necessidade de uma metodologia multilocus que possa ser uma melhor abordagem a adotar, por forma a responder às questoes acima mencionadas. Neste trabalho, utilizámos então uma abordagem multilocus, ou seja, dados de RAD-Seq das cigarras do género Tettigettalna. Com este tipo de dados e utilizando ferramentas de limpeza e filtragem dos dados, como o Ipyrad, VCFtools e outros scripts, foi assim possível gerar resultados que permitiram responder melhor a questões que até agora não tinham sido respondidas à luz de abordagens single locus e/ou com dados de outras naturezas. Com esta nova abordagem mostrámos que os dados RAD-Seq tornam evidentes os padrões de distribuição geográficos das espécies/populações das cigarras do género Tettigettalna, bem como parecem indicar que a partilha de haplótipos entre Tettigettalna argentata e Tettigettalna mariae de populações simpátricas na região Algarvia, é explicada pelo fenómeno de introgressão.Understanding population divergence and speciation among closely related species has long been a challenge in evolutionary biology. Cytoplasmic DNA markers, which have been widely used in the context of molecular barcoding, have not always proved successful in resolving phylogenies and other related questions. With the advent of Next-Generation Sequencing technologies and associated techniques of reduced genome representation, not only the phylogenies of closely related species are now being resolved at a much greater detail, but are also allpwing a much better understanding on divergence and speciation patterns and processes. Here we examine the potential of one of such techniques - Restriction-site Associated DNA (RAD) sequencing -, in disentangling questions related to the divergence and speciation of a particular group of insects, the meditteranean cicadas from the Tettigettalna genus. This genus constitutes a complex of closely related and recently diverged species. They are morphologically similar what makes them a taxonomical challenging group. The calling songs are the main character used for their identification. Work focused on the Mediterranean species of this genus revealed the accurance of sympatric populations among some of the southern Iberian Tettigettalna species. In fact, Tettigettalna mariae and Tettigettalna argentata populations can be found in sympatry or close parapatry. As already referred, these two species are morphologically very similar and only distinguishable by their calling songs. However, mitochondrial COI studies also showed that these species share haplotypes but the results couldn’t reveal if this sharing was due to introgression (existence of gene flow between populations) or incomplete lineage sorting (defective segregation of alleles into well-defined lineages). The present multilocus approach with RAD-Seq data, not only revealed a better understanding of the geographical patterns of distribution of the Tettigettalna species and populations, but also gave evidence that it is the phenomenom of introgression that explains the sharing of haplotypes between Tettigettalna argentata and Tettigettalna mariae, when in sympatry. Therefore, the use of the Next-Generation sequencing data, in particular RAD-seq data, in this thesis has reinforced the utility of the methodology applied to solve problems related to recent diverged complexes of species, such our study group of insects in which we were able to give a significant contribution to a better understanding of its divergence and speciation

    Similar works