4 research outputs found
A REVIEW: CONCEPTUAL DATA MODELS FOR BIOLOGICAL DOMAIN
ABSTRACT This paper demonstrates the survey and review of conceptual data models and the novel data modeling techniques of biological data. The term conceptual data modeling is used in broad categories in this sense. The biological data, its concepts and frameworks have diversity of expressiveness under the umbrella of bioinformatics. If we consider the biological data a single field of research, it is not possible to handle all these things efficiently and completely. For provision of highly maintainable and efficient solutions, which will have less cost and complexity, we must reduce its scope by making its sub domains in bioinformatics. Keep in mind the aforementioned reasons, we considered only the concept of central dogma of molecular biology; produces sequence biological data (DNA, RNA and protein structures); to describe this reviewed study of conceptual modeling. Our objectives are to provide a current state of art study of conceptual data models for a sequence biological data. Based on this research, we will propose a uniform data model for biological data for unification purposes. In this review paper, we provide the analysis and post-mortems of existing conceptual biological data models, and present their comparison, provided on the basis of conceptually proposed methodologies, Meta data, modeling methods and other critical aspects, necessary for sequence data. This study provides us the cutting edge for the integration of biological data
Proveniência de dados de workflows de bioinformática usando o banco de dados no SQL ArangoDB
Monografia (graduação)—Universidade de BrasÃlia, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2015.Este trabalho apresenta uma análise da utilização do sistema gerenciador de banco de
dados NoSQL ArangoDB em workflow de Bioinformática. O ArangoDB é um banco
hÃbrido que possui um modelo baseado em grafo e em documento para persistência de
dados. Para isso, foi realizado um estudo sobre o armazenamento de dados gerados na fases
de filtragem e de mapeamento de um workflow de Bioinformática, bem como a geração
de grafos de proveniência a partir dos processos utilizados. O estudo foi motivado pela
possibilidade de se armazenar os dados gerados ao longo do processamento do workflow
e informações sobre sua execução em um mesmo lugar, o que facilitaria a reexecução de
um workflow cientÃfico, visto que não seria necessário buscar novamente os dados que
foram utilizados em um dado experimento. Como resultado, este trabalho demonstra
como os dados gerados pelo workflow e seus dados de proveniência foram armazenados
no ArangoDB utilizando o modelo PROV-DM.This work presents a study about the use of the database management system NoSQL
ArangoDB in Bioinformatics workflow. The ArangoDB is a database that has a hybrid
model based on graph and document for data persistence. It was studied the storing of
data of the filtering and mapping stages from a Bioinformatics workflow, as well the provenance
graph generated by the used process. The study was motivated by the possibility of
storing data generated during the processing of the workflow and data about its execution
in one place, which would facilitate the re-execution of a scientific workflow, because it
would not be necessary to look again the data that were used in a given experiment. As
a result, this work demonstrates how the data generated by workflow and its provenance
were stored on ArangoDB using the PROV-DM model
NoSQL Cassandra : um estudo de caso com workflows de bioinformática
Trabalho de Conclusão de Curso (graduação)—Universidade de BrasÃlia, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016.Projetos de Bioinformática, geralmente„ são executados como workflows cientÃficos. Biólogos podem executar um mesmo workflow diversas vezes com diferentes parâmetros, com o objetivo de comparar os resultados obtidos e refinar a análise dos dados. Essas execuções geram vários arquivos com formatos e tamanhos diferentes, os quais precisam ser armazenados para futuras execuções. Para o gerenciamento de grandes volumes de dados, novos modelos de banco de dados, denominados NoSQL (Not Only SQL), tem sido especificados. Neste contexto, esta monografia apresenta uma avaliação do uso do sistema gerenciador de banco de dados Cassandra em workflows cientÃficos de Bioinformática.Projects in bioinformatics are usually executed as scientific workflows. Biologists often execute the same workflow many times with different settings so that data is refined. These executions generate many files with different size and formats which needs to be stored for further executions. To manage huge volumes of data, database models known as NoSQL (Not Only SQL) are being specified. In this context, this undergraduate thesis presents an evaluation of the Cassandra database in bioinformatic scientifics workflows