1 research outputs found

    Análise de sequências de DNA metagenômico de solos da Floresta Atlântica paranaense : implicações ecológicas e biotecnológicas

    Get PDF
    Orientador : Prof. Dr. Helisson FaoroDissertação (mestrado) - Universidade Federal do Paraná, Setor de Educação Profissional e Tecnológica, Programa de Pós-Graduação em Bioinformática. Defesa: Curitiba, 24/02/2017Inclui referências : f. 68-73Resumo: A Floresta Atlântica Paranaense é um dos 25 hotspots de biodiversidade do mundo, sendo conhecida por sua grande diversidade de fauna e flora. Mas pouco se sabe sobre a diversidade microbiana de seu solo. A Metagenômica é o campo de estudo de DNA de amostras ambientais e por meio de suas técnicas é possível acessar o DNA de comunidades microbianas e inferir informações filogenéticas e funcionais, além de obter genomas de microrganismos não cultiváveis em laboratório. Neste trabalho, foram combinadas técnicas de Metagenômica e tecnologias de sequenciamento de nova geração (NGS) para estudar amostras de DNA do solo da Mata Atlântica Paranaense. As amostras de solo foram coletadas em Julho de 2004 e Janeiro de 2007 em baixa (161 m), média (604 m) e alta altitudes (900 m). O DNA total purificado foi sequenciado pelas plataformas Illumina MiSeq e Ion Proton. O gene 16S rDNA foi amplificado para todas as amostras e sequenciado na plataforma Illumina MiSeq. Foram geradas 371.561 leituras de 16S rDNA e 66.936.100 leituras de DNA total, que foram submetidas a análises de diversidade e funcionais com os programas QIIME e MG-RAST. A montagem de genomas parciais foi realizada com os programas CLC Genomics Workbench e MEGAHIT. Durante as análises de diversidade, tanto baseada no DNA total quanto no gene 16S rDNA, foi identificada a predominância dos filos Acidobacteria e Proteobacteria. Entretanto, houve uma diferença na proporção dos filos identificados comparando-se somente sequências amplificadas de 16S rDNA e DNA total. Já a aplicação de tecnologias diferentes de sequenciamento de DNA não teve influência sobre a distribuição dos filos. As análises funcionais revelaram que a maioria das sequências de DNA total estão relacionadas a funções de metabolismo, principalmente metabolismo de carboidratos e aminoácido e derivados. A melhor montagem de genoma foi obtida pelo programa CLC Genomics Workbench para a amostra MAF1 usando dados Illumina MiSeq e gerou 16.426 contigs acima de 1.000 pb e maior contig com 35.630 pb. Os 16.426 contigs foram analisados com o blastn no banco de dados nr do NCBI e obtiveram similaridade com 3.010 sequências depositadas no banco de dados referentes aos genomas de organismos dos filos Acidobacteria, Proteobacteria e outros. O uso de sequenciamento de DNA NGS para exploração da diversidade microbiana nos solos da Floresta Atlântica Paranaense revelou a existência de uma grande microdiversidade com a presença de muitos filos bacterianos e que os resultados independem da tecnologia NGS, mas são influenciados pela época que foi coletado o DNA usado para sequenciamento. Palavras-chave: Metagenômica, Floresta Atlântica, DNA de solo, Sequenciamento NGS, Análise de diversidade, Análise funcional.Abstract: The Paraná Atlantic Forest is one of the 25 biodiversity hotspots in the world, known for its great diversity of fauna and flora. But little is known about the microbial diversity of its soil. Metagenomics is the field that studies DNA from environmental samples allowing the access to the microbial communities DNA retrieving phylogenetic and functional information, in addition to obtaining genomes from non-cultivable microorganisms. In this work, Metagenomics techniques and new generation sequencing technologies (NGS) were combined to study DNA samples from the soil of the Atlantic Forest of Parana. Soil samples were collected in July 2004 and January 2007 at low (161 m), mean (604 m) and high altitudes (900 m). Total purified DNA was sequenced by the Illumina MiSeq and Ion Proton platforms. The 16S rDNA gene was amplified for all samples and sequenced on the Illumina MiSeq platform. A total of 371,561 reads of 16S rRNA and 66,936,100 reads of total DNA were generated, which were submitted to diversity and functional analysis with the QIIME and MG-RAST programs. The assembly of partial genomes was performed with the CLC Genomics Workbench and MEGAHIT programs. During the analysis of diversity, both based on total DNA and 16S rDNA gene, the predominance of Acidobacteria and Proteobacteria was identified. However, there was a difference in the proportion of the identified phyla comparing only amplified 16S rDNA and total DNA sequences. On the other hand, the application of different technologies of DNA sequencing had no influence on the distribution of phyla. Functional analyzes revealed that most of the total DNA sequences are related to metabolism functions, main carbohydrates and amino acids and derivatives metabolism. The best genome assembly was obtained by the CLC Genomics Workbench program for the MAF1 sample using Illumina MiSeq data and generated 16,426 contigs above 1,000 bp and higher contig with 35,630 bp. The 16,426 contigs were compared to NCBI nr database using blastn and obtained similarity with 3,010 sequences referring to the genomes of organisms from Acidobacteria, Proteobacteria and other phyla. The use of NGS DNA sequencing for the exploration of microbial diversity in the Atlantic Forest soils revealed the existence of a large micro-diversity with the presence of many bacterial phyla and that the results are independent of the NGS technology but are influenced by the time that was collected the DNA used for sequencing. Keywords: Metagenomics, Atlantic Forest, Soil DNA, NGS sequencing, Diversity analysis, Functional analysis
    corecore