2 research outputs found

    Uma ferramenta de geração de grafos de proveniência para bioinformática

    Get PDF
    Monografia (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2013.A maioria dos experimentos realizados pela bioinformática possui uma grande quantidade de dados e são compostos por várias etapas. Algumas dessas etapas demandam tempo dos pesquisadores – tempo este que poderia ser utilizado de forma mais eficiente. Nessa perspectiva, foram criados workflows científicos para possibilitar certa automatização nos processos. Contudo, por se manipular grande quantidade de informação, é também muito importante para os pesquisadores considerar o caminho que esses dados percorrem durante a execução do workflow. A persistência do caminho desses dados é chamado de proveniência de dados. Este trabalho de conclusão de curso tratou de criar, a partir de um modelo de dados, um sistema web capaz de criar grafos de proveniência a partir da persistência das informações em um banco de dados.Vast majority of the experiments realized by bioinformatics uses a great amount of data and follows a series of steps. Some of these steps demands time from the researchers that could be used in a more efficient way. In this perspective, scientific workflows were created to provide certain automation in these steps. However, when using great amount of information, knowing about the path the data traveled is very important for the researchers. The persistence of the path of this data is called provenance. Therefore, this final project consisted in creating, by using a data model as a starting point, a web system capable of generating provenance graphs from the persistence of the data in a database

    NoSQL Cassandra : um estudo de caso com workflows de bioinformática

    Get PDF
    Trabalho de Conclusão de Curso (graduação)—Universidade de Brasília, Instituto de Ciências Exatas, Departamento de Ciência da Computação, 2016.Projetos de Bioinformática, geralmente„ são executados como workflows científicos. Biólogos podem executar um mesmo workflow diversas vezes com diferentes parâmetros, com o objetivo de comparar os resultados obtidos e refinar a análise dos dados. Essas execuções geram vários arquivos com formatos e tamanhos diferentes, os quais precisam ser armazenados para futuras execuções. Para o gerenciamento de grandes volumes de dados, novos modelos de banco de dados, denominados NoSQL (Not Only SQL), tem sido especificados. Neste contexto, esta monografia apresenta uma avaliação do uso do sistema gerenciador de banco de dados Cassandra em workflows científicos de Bioinformática.Projects in bioinformatics are usually executed as scientific workflows. Biologists often execute the same workflow many times with different settings so that data is refined. These executions generate many files with different size and formats which needs to be stored for further executions. To manage huge volumes of data, database models known as NoSQL (Not Only SQL) are being specified. In this context, this undergraduate thesis presents an evaluation of the Cassandra database in bioinformatic scientifics workflows
    corecore