4 research outputs found

    A REVIEW: CONCEPTUAL DATA MODELS FOR BIOLOGICAL DOMAIN

    Get PDF
    ABSTRACT This paper demonstrates the survey and review of conceptual data models and the novel data modeling techniques of biological data. The term conceptual data modeling is used in broad categories in this sense. The biological data, its concepts and frameworks have diversity of expressiveness under the umbrella of bioinformatics. If we consider the biological data a single field of research, it is not possible to handle all these things efficiently and completely. For provision of highly maintainable and efficient solutions, which will have less cost and complexity, we must reduce its scope by making its sub domains in bioinformatics. Keep in mind the aforementioned reasons, we considered only the concept of central dogma of molecular biology; produces sequence biological data (DNA, RNA and protein structures); to describe this reviewed study of conceptual modeling. Our objectives are to provide a current state of art study of conceptual data models for a sequence biological data. Based on this research, we will propose a uniform data model for biological data for unification purposes. In this review paper, we provide the analysis and post-mortems of existing conceptual biological data models, and present their comparison, provided on the basis of conceptually proposed methodologies, Meta data, modeling methods and other critical aspects, necessary for sequence data. This study provides us the cutting edge for the integration of biological data

    Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB

    Get PDF
    Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015.Este trabalho apresenta uma análise da utilização do sistema gerenciador de banco de dados NoSQL ArangoDB em workflow de Bioinformática. O ArangoDB é um banco híbrido que possui um modelo baseado em grafo e em documento para persistência de dados. Para isso, foi realizado um estudo sobre o armazenamento de dados gerados na fases de filtragem e de mapeamento de um workflow de Bioinformática, bem como a geração de grafos de proveniência a partir dos processos utilizados. O estudo foi motivado pela possibilidade de se armazenar os dados gerados ao longo do processamento do workflow e informações sobre sua execução em um mesmo lugar, o que facilitaria a reexecução de um workflow científico, visto que não seria necessário buscar novamente os dados que foram utilizados em um dado experimento. Como resultado, este trabalho demonstra como os dados gerados pelo workflow e seus dados de proveniência foram armazenados no ArangoDB utilizando o modelo PROV-DM.This work presents a study about the use of the database management system NoSQL ArangoDB in Bioinformatics workflow. The ArangoDB is a database that has a hybrid model based on graph and document for data persistence. It was studied the storing of data of the filtering and mapping stages from a Bioinformatics workflow, as well the provenance graph generated by the used process. The study was motivated by the possibility of storing data generated during the processing of the workflow and data about its execution in one place, which would facilitate the re-execution of a scientific workflow, because it would not be necessary to look again the data that were used in a given experiment. As a result, this work demonstrates how the data generated by workflow and its provenance were stored on ArangoDB using the PROV-DM model

    NoSQL Cassandra : um estudo de caso com workflows de bioinformática

    Get PDF
    Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016.Projetos de Bioinformática, geralmente„ são executados como workflows científicos. Biólogos podem executar um mesmo workflow diversas vezes com diferentes parâmetros, com o objetivo de comparar os resultados obtidos e refinar a análise dos dados. Essas execuções geram vários arquivos com formatos e tamanhos diferentes, os quais precisam ser armazenados para futuras execuções. Para o gerenciamento de grandes volumes de dados, novos modelos de banco de dados, denominados NoSQL (Not Only SQL), tem sido especificados. Neste contexto, esta monografia apresenta uma avaliação do uso do sistema gerenciador de banco de dados Cassandra em workflows científicos de Bioinformática.Projects in bioinformatics are usually executed as scientific workflows. Biologists often execute the same workflow many times with different settings so that data is refined. These executions generate many files with different size and formats which needs to be stored for further executions. To manage huge volumes of data, database models known as NoSQL (Not Only SQL) are being specified. In this context, this undergraduate thesis presents an evaluation of the Cassandra database in bioinformatic scientifics workflows

    A Conceptual Model for Transcriptome High-Throughput Sequencing Pipeline

    No full text
    corecore