Comparative genomic analyses of cyanobacteria

Abstract

Tese de mestrado em Biologia Evolutiva e do Desenvolvimento, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2017O presente trabalho teve como objectivo estudar o genoma de 6 (seis) estirpes de cianobactérias recolhidas de locais distintos de Portugal continental. Durante a duração do projecto, propusemo-nos a extrair e quantificar DNA genómico das estirpes mencionadas para, então, procedermos à sua sequenciação. A posterior análise dos dados obtidos focou-se em procurar genes conhecidos de resistência a antibióticos bem como outros elementos genómicos que possam conferir fenótipos de resistência a substâncias antimicrobianas. As cianobactérias são um grupo de procariotas muito estudado quanto à sua prevalência em reservatórios de água para consumo humano e animal. A sua importância prende-se no facto de diversas linhagens de cianobactérias produzirem compostos tóxicos, nomeadamente microcistinas. Estes compostos são nocivos para células eucarióticas, podendo mesmo conduzir à morte dos indivíduos que as ingerem. Para além disto, este grupo de organismos apresenta capacidade de fotossíntese oxigénica, contribuindo para a produção de oxigénio a partir de compostos orgânicos. Mais recentemente, o papel das cianobactérias como parte integrante das comunidades de microorganismos que habitam ambientes aquáticos foi repensado. Estas bactérias proliferam tanto em ´agua doce como em água salgada e contribuem para o pool genético das comunidades em que se encontram. As cianobactérias são capazes de adquirir e partilhar tanto genes como outros elementos genómicos, nomeadamente através de transferência horizontal. A fluidez dos genomas bacterianos sugere que, tal como os restantes genes, os genes de resistência a antibióticos são partilhados pela comunidade microbiana. Este pool de genes de resistência denomina-se resistoma. Na medida em que as cianobactérias apresentam fenótipos de resistência a antibióticos, o seu papel no resistoma destas comunidades começa a ser alvo de estudo. De forma a caracterizar o resistoma de uma comunidade microbiana, é necessário conhecer todos os genes que possam conferir resistência a determinados antibióticos. Para tal, é essencial sequenciar o genoma completo dos indivíduos recolhidos. A Estela Sousa e Silva Algae Culture Collection (ESSACC), actualmente localizada no Instituto de Saúde Doutor Ricardo Jorge, e a Blue Biotechnology and Ecotoxicology Culture Collection (LEGE), localizada no Centro Interdisciplinar de Investigação Marinha e Ambiental (CIIMAR), permitem-nos iniciar um estudo de caracterização do resistoma de microorganismos de água doce em Portugal. Estas coleções incluem amostras de reservatórios naturais, estações de tratamento de águas residuais e barragens. As amostras caracterizam-se por pertencer a diversas espécies com fenótipos distintos, nomeadamente no que diz respeito a coloração, forma e produção de colónias. Após um estudo prévio de caracterização dos fenótipos de resistência a antibióticos de numerosas amostras, 6 estirpes foram escolhidas para este trabalho. Esta seleção teve em conta fenótipos de resistência contrastantes, ou seja, a escolha teve por base estirpes que apresentassem susceptibilidades diferentes para dados grupos de antibióticos. Ainda assim, todas as estirpes apresentaram resistência ao trimetoprim e ao ácido nalidíxico. Duas estirpes pertencem à espécie Microcystis aeruginosa (LMECYA7 e LMECYA167), outras duas são classificadas como Plantothrix agardhii (LMECYA269 e LMECYA280) e as restantes duas como Planktothrix mougeotii (LEGE06226 e LEGE06233). Quanto à sequenciação, optámos por utilizar o método de terceira geração MinION (Oxford Nanopore Technologies, ONT, UK). O pequeno aparelho de sequenciação funciona através de uma ligação USB 3.0 a qualquer computador portátil ou desktop. A sequenciação dá-se através de um poro que está ligado a um transdutor de sinal elétrico. A molécula de DNA passa através do poro e a corrente medida é transformada numa sequência de bases. Este método tem inúmeras vantagens, nomeadamente: - Permite obter reads longas, na ordem dos milhares de pares de bases (base pairs, bp), o que não é possível através dos métodos convencionais de segunda geração; - Permite obter sequências a partir de DNA não amplificado, ou seja, reduz-se a necessidade aumentar a quantidade de DNA através de PCR; - Permite visualizar o processo de sequenciação em tempo real, no que diz respeito ao rendimento de cada corrida. Para além das vantagens supra referidas, uma das modalidades deste método permite preparar a biblioteca genómica para sequenciação em apenas alguns minutos. Contudo, o processo de obtenção do DNA constitui o passo limitante no que diz respeito a uma sequenciação bem sucedida. A qualidade e quantidade de DNA utilizado para a preparação da biblioteca têm de obeceder a critérios rigorosos. O tamanho dos fragmentos que constituem a biblioteca é um outro factor limitante, no sentido em que, quanto mais fragmentado estiver o DNA, mais pequenas serão as reads obtidas. Portanto, menor será a resolução do genoma que os dados vão permitir. Em suma, realizámos duas rondas de sequenciação com MinION. Na primeira, procedemos a uma corrida de teste, na qual sequenciámos DNA de fago lambda, fornecido pela ONT. Sequenciámos ainda duas bibliotecas de DNA de cianobactérias, pertencentes `as estirpes LMECYA167 e LEGE06233. O DNA genómico de ambas as estirpes foi obtido através da utilização de um kit de extração. Relativamente à segunda ronda de sequenciação, extraímos o DNA das 6 estirpes já mencionadas através da realização de um protocolo de fenol-clorofórmio. Este protocolo tem como objectivo a obtenção de material genético de elevado peso molecular. No final de ambas as rondas de sequenciação, conseguimos obter scaffolds dos genomas das duas estirpes de M. aeruginosa em estudo, isto é, das estirpes LMECYA7 e LMECYA167. Os dados obtidos para as restantes estirpes ficaram aquém das expectativas, no sentido em que não permitiram obter cobertura significativa de nenhum dos genomas. A análise dos dados de todas as sequenciações revelou que a qualidade das reads obtidas foi baixa. Os dados foram, então, filtrados para que apenas as reads de melhor qualidade fossem assembladas e alinhadas aos respectivos genomas de referˆencia. Porém, para todas as estirpes do género Planktothrix, a quantidade de reads mapeada contra a referência e, consequentemente, a cobertura obtida foram irrisórias. Quanto aos scaffolds dos genomas das estirpes de M. aeruginosa, ambas produziram uma sequência consensus maior que metade do genoma de referência. Assim sendo, procedemos à análise dos potenciais genes de resistência a antibióticos presentes nas sequências referidas. Tanto em LMECYA7 como em LMECYA167, foram encontrados potenciais homólogos de genes associados a resistências. Na maioria dos casos, estes genes pertencem a componentes proteicos de bombas de efluxo. Alguns dos outros possíveis genes homólogos encontrados surgem associados a resistência a beta-lactâmicos, quinolonas e sulfonamidas. Genes de resistência a tetraciclina também estão presentes na lista de resultados. Finalmente, a anotação dos scaffolds obtidos parece ter permitido entender a base genética da resistência ao trimetoprim. Foram encontrados, nas sequências de ambas as estirpes, genes para um enzima alternativo da via metabólica dos folatos. Esta via é essencial à sobrevivência destes microorganismos e o trimetoprim actua de forma a inibir um dos enzimas da via. Com a presença de um enzima alternativo, a resistência ao antibiótico é assegurada. Em conclusão, os dados obtidos através de sequenciação de terceira geração permitiram obter scaffolds de dois genomas de cianobactérias. O processo de sequenciação foi simples, mas limitado pelo relativo sucesso do processo de extração. A análise dos dados também foi limitada pela actualização constante dos softwares em actual desenvolvimento. Em última análise, foi possível detectar sinais de adaptação no que diz respeito à evolução de fenótipos de resistência a antibióticos nas estirpes em estudo.Cyanobacteria are photosynthetic organisms that can be found in water bodies worldwide. Cyanobacterial lineage evolution resulted in numerous color, shape and colony-forming phenotypes. Most cyanobacteria produce several toxins, but only a few are capable of nitrogen (N2) fixation. Most interestingly, these bacteria exhibit antimicrobial activity, as well as antibiotic resistance phenotypes. Therefore, it has been suggested that cyanobacteria might harbor several antibiotic resistance (AR) genes. Consequently, it has been hypothesized that these bacteria might play a major role in the dissemination of antibiotic resistance phenotypes in microbial communities. Whole-genome sequencing is necessary to fully characterize the genetic basis of such AR phenotypes. In particular, long-read third-generation sequencing methods might help resolve the genomic structure of AR gene containing regions. Horizontally transferred AR genes are often flanked by highly repetitive sequences, not completely resolved by high-throughput next generation sequencing technologies. Here, we report the use of the portable MinION (Oxford Nanopore Technologies, UK) sequencing device to obtain the genome sequences of six strains of cyanobacteria. Said biological isolates were collected at different time points in freshwater bodies across Portugal. We obtained genome scaffolds for two Microcystis aeruginosa strains. The LMECYA7 scaffold resulted from a hybrid assembly using not only MinION data but also Illumina paired-end reads. The LMECYA167 genome scaffold represented more than 68% of the reference genome and was entirely built from MinION 1D reads. For both strains, more than one hundred homologous AR gene sequences were found. Among these, fluoroquinolone, beta-lactam and sulfonamide resistance-associated genes were present. Moreover, genome annotation might have unveiled the genetic basis of trimethoprim resistance in the aforementioned cyanobacterial strains. The presence of an alternative folate pathway enzyme (thymidylate synthase, thyX) could fully account for such trimethoprim resistance phenotype. In summary, MinION sequencing allowed us to not only find several homologous AR genes, but also pinpoint the genetic mechanism that is responsible for trimethoprim resistance in two strains of cyanobacteria. Lastly, the process of gDNA extraction requires further optimization, in order to obtain maximum MinION sequencing yield

    Similar works