30 research outputs found

    G-Finisher : uma nova estratégia para refinar e finalizar montagens de genomas bacterianos

    Get PDF
    Orientador : Prof. Dr. Fábio de Oliveira PedrosaCoorientadores : Profª. Drª. Maria Berenice Reynaud Steffens e Prof. Dr. Roberto Tadeu RaittzTese (doutorado) - Universidade Federal do Paraná, Setor de Ciências Biológicas, Programa de Pós-Graduação em Ciências : Bioquímica. Defesa: Curitiba, 27/07/2016Inclui referências: f. 113-121Resumo: O processo de reconstrução completa da sequência de DNA dos genomas bacterianos ainda é complexo. Apenas 13% dos projetos de sequenciamento de genomas procarióticos são concluídos. Versões rascunho da sequência do genoma são depositadas nos bancos de dados públicos, na forma fragmentada de contigs e com prováveis perdas de informações gênicas. Esta tese tem o objetivo de identificar erros de montagem e melhorar o processo de montagem de genomas de bactérias. Padrões biólogos observados em sequências genômicas e a utilização de informação a priori permitem a identificação de regiões com erros de montagem, reorganizar as sequências e melhorar a montagem do genoma. Com a finalidade de melhorar a finalização das montagens, os contigs são quebrados nos pontos de máximo e mínimo local da curva Fuzzy-GC-Skew e armazenados em nós de um grafo sem bordas. Esses nós são ordenados com base na sequência de referência e submetidos para fechamento das lacunas pelo jFGap. No método desenvolvido neste trabalho - G-Finisher -, os contigs são quebrados nos pontos críticos da curva Fuzzy GC Skew, reordenados e as lacunas fechadas com o jFGap. O G-Finisher foi testado nas 96 montagens obtidas pelo GAGE-B e reduziu na média 86% o número de contigs. G-Finisher pode facilmente melhorar os projetos de montagens de genomas de procariotos, de modo que os programas de montagem podem ser melhorados com a incorporação do G-Finisher ou com a utilização de padrões de sequências biológicas. O software e o código-fonte, escrito em Java, foram licenciados na forma do software livre e disponibilizados em http://gfinisher.sourceforge.net/.Abstract: The process of reconstruction of complete genome from DNA sequences is still complex. Only 13% of the prokaryotic genome sequencing projects are completely finished. Draft genome sequences deposited in public databases are fragmented in contigs and may lack the full gene content. To identify assembly errors and improve the assembly process of bacterial genomes are the purpose of this work. The biological patterns observed in genomic sequences and the application of a priori information allows the identification of misassembled regions, and the reorganization and improvement of the overall genome assembly. In order to improve the finishing of genome assemblies the contigs are broken down at the peaks (all critical points) of a Fuzzy-GC-Skew-Moving-Average graph and stored in computer nodes in a graph data structure without edges. These nodes are ordered following a reference and submitted to the gap closing software jFGap. In the proposed new method - GFinisher - critical peaks in Fuzzy GC skew graphs are broken down, reassembled and closed using jFGap. The number of contigs decreases by up 86%. This has been successfully applied to the 96 genome assemblies described and provide by GAGE-B. GFinisher can easily optimize assemblies of prokaryotic draft genomes and can be used to improve the assembly programs using biological genome sequence patterns. The software was written em Java, licensed in open-source and the binaires and source code are available at http://gfinisher.sourceforge.net/. Keywords: genome finisher, gap close, contig order, genome assembl

    Banco de dados biológico no modelo relacional para mineração de dados em genomas completos de procariotos disponibilizados pelo NCBI GenBank

    Get PDF
    Resumo: O NCBI GenBank, um dos três principais bancos de dados primários, tem centralizado as informações obtidas pelos processos de sequenciamento de DNA e/ou RNA e as tem distribuído no formato de arquivos textos. Nos servidores de arquivos do GenBank, para o Domínio Bactéria e Domínio Archea, existe um arquivo em formato específico para cada organismo, cromossomo ou plasmídeo completamente sequenciado, com seus genomas e respectivas anotações. Detectou-se a ausência de um modelo de banco de dados para armazenar todas as informações, bem como se observou a necessidade de redistribuir essas informações no formato de banco de dados relacional. Este trabalho propõe um modelo de banco de dados relacional e um conjunto de ferramentas para análise, transposição dos dados no formato texto para o modelo de banco de dados relacional desenvolvido e estratégias de atualização. O modelo foi desenvolvido a partir da análise da especificação do GenBank e da observação das informações de organismos espalhados em mais de 2000 arquivos. Para o desenvolvimento das ferramentas, adotou-se a metodologia da prototipação, padrões de projetos, testes e análises de desempenho. Os resultados obtidos demonstram a possibilidade de armazenar todos os dados nos principais SGBD, com redução significativa da redundância nos dados e obtenção de alto desempenho nas quatro etapas do processo: 1) sincronização dos arquivos de texto em um repositório local a partir do servidor de arquivos do NCBI; 2) análise dos arquivos e interpretação dos campos; 3) carga dos dados analisados no banco de dados e; 4) aderência do modelo desenvolvido com a especificação e desempenho observado nas consultas feitas. Esta dissertação contribui para um novo modelo de organização, acesso e distribuição das informações do NCBI GenBank

    IdentKit : Sistema para desenvolvimento de retratos falados

    Get PDF
    Orientador: Dieval GuizeliniMonografia (graduação) - Universidade Federal do Paraná, Escola Técnica, Curso de Tecnologia em InformáticaInclui bibliografi

    IdentKit : sistema para desenvolvimento de retratos falados

    Get PDF
    Orientador: Roberto Tadeu RaittzCo-orientador: Dieval GuizeliniMonografia (graduação) - Universidade Federal do Paraná, Escola Técnica, Curso de Tecnologia em InformáticaInclui bibliografi

    J-Orfinder

    Get PDF
    Orientador: Roberto Tadeu RaittzCo-orientador: Dieval GuizeliniMonografia (graduação) - Universidade Federal do Paraná, Escola Técnica, Curso de Tecnologia em InformáticaInclui bibliografi

    Relationship between emotion and health: a two-way street

    Get PDF
    Emotional reactions impact on people's health and quality of life. With the advent of neuroscience in the 1990s, much research has focused on the relationship between neural circuits and emotional reactions. In this sense, we have identified a 2031% growth in research linking emotions and health between 1990 and 2022. Using the Text mining tool called "Biotext Tools", we performed a literature search, focusing on diseases of old age and covid-19. Emotion molecules (EMs), produced by the endocrine system, impact the homeostasis of the body, affecting the biological balance of the body. We related the EMs with diseases of the elderly and Covid-19, in order to analyze the impact of emotional states on the development and treatment of these pathologies. To this end, the bidirectional relationship between anxiety, depression, heart disease, stroke, and Alzheimer's and Parkinson's diseases was analyzed. Finally, Coronavirus severity and mortality levels were related to cortisol, testosterone, and serotonin levels

    Sistema team groupware

    Get PDF
    Orientador: Dieval GuizeliniMonografia (graduação) - Universidade Federal do Paraná, Escola Técnica, Curso de Tecnologia em InformáticaInclui bibliografi

    EasyFan

    Get PDF
    Orientador: Dieval GuizeliniCo-orientador: Roberto Tadeu RaittzAcompanha volume com código fonteMonografia (graduação) - Universidade Federal do Paraná, Escola Técnica, Curso de Tecnologia em InformáticaInclui bibliografi

    Comparative Analysis of Genomic Island Prediction Tools

    Get PDF
    Tools for genomic island prediction use strategies for genomic comparison analysis and sequence composition analysis. The goal of comparative analysis is to identify unique regions in the genomes of related organisms, whereas sequence composition analysis evaluates and relates the composition of specific regions with other regions in the genome. The goal of this study was to qualitatively and quantitatively evaluate extant genomic island predictors. We chose tools reported to produce significant results using sequence composition prediction, comparative genomics, and hybrid genomics methods. To maintain diversity, the tools were applied to eight complete genomes of organisms with distinct characteristics and belonging to different families. Escherichia coli CFT073 was used as a control and considered as the gold standard because its islands were previously curated in vitro. The results of predictions with the gold standard were manually curated, and the content and characteristics of each predicted island were analyzed. For other organisms, we created GenBank (GBK) files using Artemis software for each predicted island. We copied only the amino acid sequences from the coding sequence and constructed a multi-FASTA file for each predictor. We used BLASTp to compare all results and generate hits to evaluate similarities and differences among the predictions. Comparison of the results with the gold standard revealed that GIPSy produced the best results, covering ~91% of the composition and regions of the islands, followed by Alien Hunter (81%), IslandViewer (47.8%), Predict Bias (31%), GI Hunter (17%), and Zisland Explorer (16%). The tools with the best results in the analyzes of the set of organisms were the same ones that presented better performance in the tests with the gold standard
    corecore