2 research outputs found

    Genomic synteny between sorghum and sugarcane inferred from a BAC pool sequencing

    Get PDF
    Orientador: Paulo ArrudaTese (doutorado) - Universidade Estadual de Campinas, Instituto de BiologiaResumo: O sequenciamento genômico de plantas tem se acelerado nos últimos anos principalmente devido ao avanço das tecnologias de sequenciamento de nova geração, capazes de gerar um grande volume de dados com custo cada vez menor. No entanto, o sequenciamento e a montagem de genomas de plantas ainda continua sendo um grande desafio em função da alta complexidade desses genomas que na sua grande maioria possuem alto grau de ploidia e grande proporção de sequências repetitivas. O sequenciamento de bibliotecas produzidas com DNA genômico de plantas clonados em vetores BACs (bacterial artificial chromosomes) pode ser uma estratégia efetiva para sequenciamento de genomas complexos, por dividir a tarefa de montagem em problemas menores. No geral, bibliotecas de BACs contém fragmentos de DNA de 100 a 200 kilobases, cujo conjunto cobre o genoma clonado várias vezes. Entretanto, mesmo com as novas tecnologias de sequenciamento, o custo de sequenciar bibliotecas de BACs ainda é alto, pois na maioria das vezes o sequenciamento é realizado a partir do DNA isolado de cada BAC individualmente. Uma alternativa seria sequenciar pools contendo centenas de BACs amostrados randomicamente, que dessa forma diminuiria o custo proporcionalmente ao número de BACs do pool. Neste trabalho, desenvolvemos um modelo para sequenciamento e montagem de pools de BACs de uma biblioteca preparada a partir de uma variedade comercial de cana-de-açúcar. Como resultado, um pool com 178 BACs de cana-de-açúcar da variedade SP80-3280 foi sequenciado utilizando-se as tecnologias HighSeq2000 da Illumina e PacBio, e montados utilizando diferentes conjuntos de softwares. Por ser uma amostra de BACs selecionados randomicamente foi possível montar 2.451 scaffolds correspondentes a 88,2% do tamanho estimado total do conjunto de BACs do pool. A completeza da montagem foi verificada de várias maneiras incluindo a análise do número de BACs montados com tamanho esperado, a comparação com BACs depositados no NCBI e pela colinearidade e ordem de genes presentes entre scaffolds de cana e os cromossomos de sorgo. Os scaffolds com tamanho superior a 2 kb foram alinhados contra o genoma de sorgo, e no geral os alinhamentos mostraram uma distribuição uniforme ao longo dos 10 cromossomos do sorgo indicando a aleatoriedade da amostragem. Pela análise sintênica entre os scaffolds de cana e os cromossomos de sorgo, observamos que o genoma monoploide da cana parece ser mais contraído em relação ao genoma do sorgo. No geral o trabalho mostrou que é possível sequenciar pool de BACs de genomas de plantas de alta complexidade como o genoma de cana-de-açúcar com altos níveis de ploidiaAbstract: The genomic sequencing of plants has accelerated in recent years mainly due to the advances of next generation sequencing technologies capable of generating a high volume of data with ever lower cost. However, the sequencing and assembly of plant genomes remains a major challenge due to the high complexity of these genomes that mostly have a high degree of ploidy and large proportion of repetitive sequences. The sequencing of libraries produced with genomic DNA of plants cloned into BAC (bacterial artificial chromosome) vectors can be an effective strategy for sequencing complex genomes, by breaking down the assembly task into smaller problems. Typical BAC libraries contain DNA fragments of 100 to 200 kilobases which together cover the genome cloned several times. However, even with the new sequencing technologies, the cost of sequencing BACs libraries is still high because most of the times the sequencing is individually performed from the isolated DNA of each BAC. An alternative would be the sequencing of pools containing hundreds of randomly sampled BACs, which thereby would decrease the cost in proportion to the number of BACs pooled. In this work we developed a model for sequencing and assembly BAC pools of a library prepared from a commercial sugarcane variety. As a result, a pool of 178 BACs from sugarcane variety SP80-3280 was sequenced using the technologies of the Illumina HighSeq2000 and PacBio and was assembled using different sets of softwares. Being a sample of randomly selected BACs was possible to assemble 2,451 scaffolds corresponding to 88.2% of the estimated total pool size set of BACs. The completeness of the assembly was verified in many ways including the analysis of the number of BACs assembled with expected size, comparison to sugarcane BACs deposited in NCBI and by the collinearity and gene order presented between sugarcane scaffolds and sorghum chromosomes. Scaffolds larger than 2 kb were aligned to the sorghum genome, and in general, alignments showed a uniform distribution over the 10 sorghum chromosomes indicating the randomness of sampling. By syntenic analysis between sugarcane scaffolds and sorghum chromosomes, we found that the monoploid sugarcane genome seems to be more contracted compared to the genome of sorghum. Overall the study showed that it is possible to sequence BAC pools from plant genomes with high complexity like the sugarcane genome with high level of ploidyDoutoradoBioinformaticaDoutor em Genetica e Biologia Molecula

    Bioinformatica de projetos genoma de bacterias

    Get PDF
    Orientador : João Carlos SetubalDissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matematica, Estatistica e Computação CientificaResumo: Este trabalho apresenta a bioinformática desenvolvida e usada nos projetos genoma XyIelIa fastidiosa e Xanthomonas. O objetivo geral da bioinformática nesses projetos é armazenar, organizar, analisar e disponibilizar os dados biológicos oriundos dos aboratórios de seqüenciamento. Em particular, são apresentados dois sistemas de software usados para a montagem e para a anotação de genomas de bactérias. A dissertação contém também um capítulo detalhando fundamentos de biologia molecular e de técnicas de seqüenciamento de DNAMestradoMestre em Ciência da Computaçã
    corecore