Análise de transcriptoma de experimentos de RNA- Seq com e sem repetições biológicas: revisão.

Abstract

The discovery of nucleic acids opened new frontiers of knowledge, enablingresearchers to access an enormous amount of data, through large-scale sequencing methodologiesand bioinformatics tools. Amongst these new possibilities, RNA-Seq has been used to identify andquantify RNA molecules. To obtain more accurate biological responses from RNA-Seq data somequestions should be considered such as experimental design, type ofsynthesized library, size ofthefragments generated, number ofbiological replicates, depth, and coverage ofthe sequencing, speciesgenome availability and, the choice of software to properly perform the computational analyzes.Accurate bioinformatics analyzes allow the selection ofgenes with a lower error rate, increasing thevalidation assertiveness via RT-qPCR and thus, reducing costs. The objective of this review was topresent the analysis stages of RNA-Seq data, from experimental design to systems biology,considering relevant points, as well as to pointed out some software currently available to carry theseanalyzes out. Besides, with this review, we aimed to help the academic community to understand allsteps and biases involved in RNA-Seq data analysis, from experiments with or without biologicalreplicates.A descoberta de ácidos nucléicos abriu novas fronteiras de conhecimento, permitindoque os pesquisadores acessassem uma enorme quantidade de dados, através de metodologias desequenciamento em larga escala e ferramentas de bioinformática. Entre essas novas possibilidades,o RNA-Seq (sequenciamento de RNA) tem sido usado para identificar e quantificar moléculas deRNA. Para obter respostas biológicas mais precisas a partir dos dados de RNA-Seq, algumasquestões devem ser consideradas, como o desenho experimental, o tipo de biblioteca sintetizada, otamanho dos fragmentos gerados, o número de repetições biológicas, a profundidade e cobertura dosequenciamento, a disponibilidade do genoma da espécie e, a escolha dos softwares para executaradequadamente as análises computacionais. Análises bioinformáticas precisas permitem a seleçãode genes com menor taxa de erro, aumentando a assertividade da validação via RT-qPCR e, assim,reduzindo custos. O objetivo desta revisão foi apresentar as etapas de análise de dados de RNA-Seq,desde o projeto experimental até a biologia dos sistemas, considerando pontos relevantes, bemcomo apontar alguns softwares atualmente disponíveis para realizar essas análises. Além disso, comesta revisão, objetivamos ajudar a comunidade acadêmica a compreender todas as etapas e viesesenvolvidos na análise de dados de RNA-Seq, a partir de experimentos com ou sem réplicasbiológicas

    Similar works