7 research outputs found

    Comparative genomic analyses of cyanobacteria

    Get PDF
    Tese de mestrado em Biologia Evolutiva e do Desenvolvimento, apresentada à Universidade de Lisboa, através da Faculdade de Ciências, 2017O presente trabalho teve como objectivo estudar o genoma de 6 (seis) estirpes de cianobactérias recolhidas de locais distintos de Portugal continental. Durante a duração do projecto, propusemo-nos a extrair e quantificar DNA genómico das estirpes mencionadas para, então, procedermos à sua sequenciação. A posterior análise dos dados obtidos focou-se em procurar genes conhecidos de resistência a antibióticos bem como outros elementos genómicos que possam conferir fenótipos de resistência a substâncias antimicrobianas. As cianobactérias são um grupo de procariotas muito estudado quanto à sua prevalência em reservatórios de água para consumo humano e animal. A sua importância prende-se no facto de diversas linhagens de cianobactérias produzirem compostos tóxicos, nomeadamente microcistinas. Estes compostos são nocivos para células eucarióticas, podendo mesmo conduzir à morte dos indivíduos que as ingerem. Para além disto, este grupo de organismos apresenta capacidade de fotossíntese oxigénica, contribuindo para a produção de oxigénio a partir de compostos orgânicos. Mais recentemente, o papel das cianobactérias como parte integrante das comunidades de microorganismos que habitam ambientes aquáticos foi repensado. Estas bactérias proliferam tanto em ´agua doce como em água salgada e contribuem para o pool genético das comunidades em que se encontram. As cianobactérias são capazes de adquirir e partilhar tanto genes como outros elementos genómicos, nomeadamente através de transferência horizontal. A fluidez dos genomas bacterianos sugere que, tal como os restantes genes, os genes de resistência a antibióticos são partilhados pela comunidade microbiana. Este pool de genes de resistência denomina-se resistoma. Na medida em que as cianobactérias apresentam fenótipos de resistência a antibióticos, o seu papel no resistoma destas comunidades começa a ser alvo de estudo. De forma a caracterizar o resistoma de uma comunidade microbiana, é necessário conhecer todos os genes que possam conferir resistência a determinados antibióticos. Para tal, é essencial sequenciar o genoma completo dos indivíduos recolhidos. A Estela Sousa e Silva Algae Culture Collection (ESSACC), actualmente localizada no Instituto de Saúde Doutor Ricardo Jorge, e a Blue Biotechnology and Ecotoxicology Culture Collection (LEGE), localizada no Centro Interdisciplinar de Investigação Marinha e Ambiental (CIIMAR), permitem-nos iniciar um estudo de caracterização do resistoma de microorganismos de água doce em Portugal. Estas coleções incluem amostras de reservatórios naturais, estações de tratamento de águas residuais e barragens. As amostras caracterizam-se por pertencer a diversas espécies com fenótipos distintos, nomeadamente no que diz respeito a coloração, forma e produção de colónias. Após um estudo prévio de caracterização dos fenótipos de resistência a antibióticos de numerosas amostras, 6 estirpes foram escolhidas para este trabalho. Esta seleção teve em conta fenótipos de resistência contrastantes, ou seja, a escolha teve por base estirpes que apresentassem susceptibilidades diferentes para dados grupos de antibióticos. Ainda assim, todas as estirpes apresentaram resistência ao trimetoprim e ao ácido nalidíxico. Duas estirpes pertencem à espécie Microcystis aeruginosa (LMECYA7 e LMECYA167), outras duas são classificadas como Plantothrix agardhii (LMECYA269 e LMECYA280) e as restantes duas como Planktothrix mougeotii (LEGE06226 e LEGE06233). Quanto à sequenciação, optámos por utilizar o método de terceira geração MinION (Oxford Nanopore Technologies, ONT, UK). O pequeno aparelho de sequenciação funciona através de uma ligação USB 3.0 a qualquer computador portátil ou desktop. A sequenciação dá-se através de um poro que está ligado a um transdutor de sinal elétrico. A molécula de DNA passa através do poro e a corrente medida é transformada numa sequência de bases. Este método tem inúmeras vantagens, nomeadamente: - Permite obter reads longas, na ordem dos milhares de pares de bases (base pairs, bp), o que não é possível através dos métodos convencionais de segunda geração; - Permite obter sequências a partir de DNA não amplificado, ou seja, reduz-se a necessidade aumentar a quantidade de DNA através de PCR; - Permite visualizar o processo de sequenciação em tempo real, no que diz respeito ao rendimento de cada corrida. Para além das vantagens supra referidas, uma das modalidades deste método permite preparar a biblioteca genómica para sequenciação em apenas alguns minutos. Contudo, o processo de obtenção do DNA constitui o passo limitante no que diz respeito a uma sequenciação bem sucedida. A qualidade e quantidade de DNA utilizado para a preparação da biblioteca têm de obeceder a critérios rigorosos. O tamanho dos fragmentos que constituem a biblioteca é um outro factor limitante, no sentido em que, quanto mais fragmentado estiver o DNA, mais pequenas serão as reads obtidas. Portanto, menor será a resolução do genoma que os dados vão permitir. Em suma, realizámos duas rondas de sequenciação com MinION. Na primeira, procedemos a uma corrida de teste, na qual sequenciámos DNA de fago lambda, fornecido pela ONT. Sequenciámos ainda duas bibliotecas de DNA de cianobactérias, pertencentes `as estirpes LMECYA167 e LEGE06233. O DNA genómico de ambas as estirpes foi obtido através da utilização de um kit de extração. Relativamente à segunda ronda de sequenciação, extraímos o DNA das 6 estirpes já mencionadas através da realização de um protocolo de fenol-clorofórmio. Este protocolo tem como objectivo a obtenção de material genético de elevado peso molecular. No final de ambas as rondas de sequenciação, conseguimos obter scaffolds dos genomas das duas estirpes de M. aeruginosa em estudo, isto é, das estirpes LMECYA7 e LMECYA167. Os dados obtidos para as restantes estirpes ficaram aquém das expectativas, no sentido em que não permitiram obter cobertura significativa de nenhum dos genomas. A análise dos dados de todas as sequenciações revelou que a qualidade das reads obtidas foi baixa. Os dados foram, então, filtrados para que apenas as reads de melhor qualidade fossem assembladas e alinhadas aos respectivos genomas de referˆencia. Porém, para todas as estirpes do género Planktothrix, a quantidade de reads mapeada contra a referência e, consequentemente, a cobertura obtida foram irrisórias. Quanto aos scaffolds dos genomas das estirpes de M. aeruginosa, ambas produziram uma sequência consensus maior que metade do genoma de referência. Assim sendo, procedemos à análise dos potenciais genes de resistência a antibióticos presentes nas sequências referidas. Tanto em LMECYA7 como em LMECYA167, foram encontrados potenciais homólogos de genes associados a resistências. Na maioria dos casos, estes genes pertencem a componentes proteicos de bombas de efluxo. Alguns dos outros possíveis genes homólogos encontrados surgem associados a resistência a beta-lactâmicos, quinolonas e sulfonamidas. Genes de resistência a tetraciclina também estão presentes na lista de resultados. Finalmente, a anotação dos scaffolds obtidos parece ter permitido entender a base genética da resistência ao trimetoprim. Foram encontrados, nas sequências de ambas as estirpes, genes para um enzima alternativo da via metabólica dos folatos. Esta via é essencial à sobrevivência destes microorganismos e o trimetoprim actua de forma a inibir um dos enzimas da via. Com a presença de um enzima alternativo, a resistência ao antibiótico é assegurada. Em conclusão, os dados obtidos através de sequenciação de terceira geração permitiram obter scaffolds de dois genomas de cianobactérias. O processo de sequenciação foi simples, mas limitado pelo relativo sucesso do processo de extração. A análise dos dados também foi limitada pela actualização constante dos softwares em actual desenvolvimento. Em última análise, foi possível detectar sinais de adaptação no que diz respeito à evolução de fenótipos de resistência a antibióticos nas estirpes em estudo.Cyanobacteria are photosynthetic organisms that can be found in water bodies worldwide. Cyanobacterial lineage evolution resulted in numerous color, shape and colony-forming phenotypes. Most cyanobacteria produce several toxins, but only a few are capable of nitrogen (N2) fixation. Most interestingly, these bacteria exhibit antimicrobial activity, as well as antibiotic resistance phenotypes. Therefore, it has been suggested that cyanobacteria might harbor several antibiotic resistance (AR) genes. Consequently, it has been hypothesized that these bacteria might play a major role in the dissemination of antibiotic resistance phenotypes in microbial communities. Whole-genome sequencing is necessary to fully characterize the genetic basis of such AR phenotypes. In particular, long-read third-generation sequencing methods might help resolve the genomic structure of AR gene containing regions. Horizontally transferred AR genes are often flanked by highly repetitive sequences, not completely resolved by high-throughput next generation sequencing technologies. Here, we report the use of the portable MinION (Oxford Nanopore Technologies, UK) sequencing device to obtain the genome sequences of six strains of cyanobacteria. Said biological isolates were collected at different time points in freshwater bodies across Portugal. We obtained genome scaffolds for two Microcystis aeruginosa strains. The LMECYA7 scaffold resulted from a hybrid assembly using not only MinION data but also Illumina paired-end reads. The LMECYA167 genome scaffold represented more than 68% of the reference genome and was entirely built from MinION 1D reads. For both strains, more than one hundred homologous AR gene sequences were found. Among these, fluoroquinolone, beta-lactam and sulfonamide resistance-associated genes were present. Moreover, genome annotation might have unveiled the genetic basis of trimethoprim resistance in the aforementioned cyanobacterial strains. The presence of an alternative folate pathway enzyme (thymidylate synthase, thyX) could fully account for such trimethoprim resistance phenotype. In summary, MinION sequencing allowed us to not only find several homologous AR genes, but also pinpoint the genetic mechanism that is responsible for trimethoprim resistance in two strains of cyanobacteria. Lastly, the process of gDNA extraction requires further optimization, in order to obtain maximum MinION sequencing yield

    Short-term adaptation in the lab : an analysis of evolutionary trajectories using time-series data

    No full text
    Experimental evolution has led to remarkable discoveries on the evolution of adaptive phenotypes. However, an understanding of the genetic basis of adaptation is only just starting to emerge, especially in eukaryotes. My thesis aims to take full advantage of genomic time-series data by examining Evolve & Resequence (E&R) experiments. This approach typically monitors the genomes of lab populations over the course of several generations. Firstly, I introduce Bait-ER: a fully Bayesian approach to investigate allele frequency trajectories while testing for selection. It implements a Moran model to estimate selection paramaters at each biallelic site. Bait-ER models varying coverage explicitly to account for sampling error. My method is robust even when studying small populations, and it proved accurate in both real and simulated genomic datasets. Secondly, I investigate the response to sexual selection in lab populations of Drosophila pseudoobscura using an E&R approach. These flies were subject to an altered mating regime where the intensity of sexual selection was either relaxed in monogamous populations - M - or intensified in polyandrous populations - E. I resequenced the genomes of each population at five separate time points. I estimated diversity and the effective population size (Nₑ) across the genome, and found that overall estimates of Nₑ match neutral expectations. However, Nₑ was lower at the start of the experiment, especially on the X chromosome in E populations. This indicates that sexual selection is strongest at the start in E lines, and that the X is responsible for early adaptation. Lastly, I performed a genome scan using Bait-ER to detect any potential targets of selection on the full genomic time-series. E lines show a stronger signal of selection where the X dominates, but the third chromosome also seems to be a hotspot. In summary, I found clear signals of adaptation in the genome of lab populations at several levels. This is in spite of strong genetic drift acting to slow down the adaptive process."This work was supported by the Vienna Science and Technology Fund (WWTF) through project MA16-064 and the School of Biology at the University of St Andrews that funded my studentship. DNA extraction and sequencing (as described in chapter 3) was supported by a Carnegie Trust Research Incentive Grant (RIG007474)."--Fundin

    Bait-ER:a Bayesian method to detect targets of selection in Evolve-and-Resequence experiments

    Get PDF
    This research was funded in part, by the Vienna Science and Technology Fund (WWTF) [MA16-061], the Biotechnology and Biological Sciences Research Council (BBSRC) [BB/W000768/1], and the Austrian Science Fund (FWF) [P34524-B]. CK received funding from the Royal Society (RG170315) and Carnegie Trust (RIG007474). The computational results presented have been partly achieved using the St Andrews Bioinformatics Unit (StABU), which is funded by a Wellcome Trust ISSF award (grant 105621/Z/14/Z).For over a decade, experimental evolution has been combined with high-throughput sequencing techniques. In so-called Evolve-and-Resequence (E&R) experiments, populations are kept in the laboratory under controlled experimental conditions where their genomes are sampled and allele frequencies monitored. However, identifying signatures of adaptation in E&R datasets is far from trivial, and it is still necessary to develop more efficient and statistically sound methods for detecting selection in genome-wide data. Here, we present Bait-ER – a fully Bayesian approach based on the Moran model of allele evolution to estimate selection coefficients from E&R experiments. The model has overlapping generations, a feature that describes several experimental designs found in the literature. We tested our method under several different demographic and experimental conditions to assess its accuracy and precision, and it performs well in most scenarios. Nevertheless, some care must be taken when analysing trajectories where drift largely dominates and starting frequencies are low. We compare our method with other available software and report that ours has generally high accuracy even for trajectories whose complexity goes beyond a classical sweep model. Furthermore, our approach avoids the computational burden of simulating an empirical null distribution, outperforming available software in terms of computational time and facilitating its use on genome-wide data. We implemented and released our method in a new open-source software package that can be accessed at https://doi.org/10.5281/zenodo.7351736.Publisher PDFPeer reviewe

    Pooled sequencing time series of Drosophila pseudoobscura experimental evolution lines (dataset)

    No full text
    Raw resequencing data collected from an evolution experiment in Drosophila pseudoobscura. Four replicates from two treatments - monogamy and elevated polyandry - were sequenced in pools of 40 individuals each. This dataset includes pool-seq Illumina reads over the course of the 200 generations of evolution at 4 time points (approx. generation 20, 60, 115 and 200). These data were used to investigate signatures of directional selection in allele frequency trajectories (see [REF] for a more detailed description of the used methods)

    Pooled sequencing time series of Drosophila pseudoobscura experimental evolution lines (dataset)

    No full text
    Raw resequencing data collected from an evolution experiment in Drosophila pseudoobscura. Four replicates from two treatments - monogamy and elevated polyandry - were sequenced in pools of 40 individuals each. This dataset includes pool-seq Illumina reads over the course of the 200 generations of evolution at 4 time points (approx. generation 20, 60, 115 and 200). These data were used to investigate signatures of directional selection in allele frequency trajectories (see [REF] for a more detailed description of the used methods)
    corecore