Statistical, visual and functional analysis of microbiome data

Abstract

The advancements in next-generation sequencing technologies have revolutionized microbiome research by allowing culture-independent high-throughput profiling of the genetic contents of microbial communities. Nowadays, 16S rRNA based marker gene sequencing is widely used to characterize the taxonomic composition and phylogenetic diversity of complex microbial communities. However, statistical, visual and functional analysis of such data possess great challenges. In addition, many aspects of the current approaches can be improved to get a better understanding of communities. The proper analysis of the resulting large and complicated datasets remains a key bottleneck in current microbiome studies. Over the last decade, powerful computational pipelines and standard protocols have been developed to support efficient raw data processing and annotation of microbiome data. The focus has now shifted towards downstream statistical analysis and functional interpretation. To address this bottleneck, we have developed MicrobiomeAnalyst, a user-friendly web-based tool that incorporates recent progresses in statistics and interactive visualization techniques, coupled with novel knowledge bases, to facilitate comprehensive analysis of common data sets generated from microbiome studies. MicrobiomeAnalyst contains four major components, including i) a module for community diversity profiling, comparative analysis and functional prediction of 16S rRNA marker gene data; ii) a module for exploratory data analysis, functional profiling and metabolic network visualization for shotgun metagenomics or metatranscriptomics data; iii) a module to help users to interpret their taxa of interest via enrichment analysis against ~300 taxon sets manually collected from recent literature and public databases; and iv) a module to allow users to visually explore their data sets within the context of compatible public data (meta-analysis) for pattern discovery and biological insights. The tool is freely accessible at http://www.microbiomeanalyst.ca.Les progrès dans les technologies de séquençage de nouvelle génération ont révolutionné la recherche sur le microbiôme en permettant un profilage à haut débit, indépendamment de la culture du contenu génétique des communautés microbiennes. De nos jours, le séquençage du gène marqueur basé sur l'ARNr 16S est largement utilisé pour caractériser la composition taxonomique et la diversité phylogénétique des communautés microbiennes complexes. Cependant, l'analyse statistique, visuelle et fonctionnelle de ces données présente de grands défis. En outre, de nombreux aspects des approches actuelles peuvent être améliorés pour mieux comprendre les communautés. L'analyse appropriée des données volumineuses et complexes reste un goulot d'étranglement majeur dans les études actuelles sur le microbiôme. Au cours de la dernière décennie, de puissantes méthodes computationnelles et des protocoles standardisés ont été développés pour prendre en charge un traitement et une annotation des données efficacement. Inversement, l'accent a désormais été mis sur l'analyse statistique en aval et l'interprétation fonctionnelle.Pour remédier à ce goulot d'étranglement, nous avons développé MicrobiomeAnalyst, un outil web convivial qui intègre les progrès récents dans les statistiques et les techniques de visualisation interactives, couplées avec de nouvelles bases de connaissances, pour faciliter l'analyse complète des profils taxonomiques et fonctionnels communs issus des études sur le microbiôme. MicrobiomeAnalyst comprend quatre modules majeurs, dont de i), un module pour le profilage de la diversité de la communauté, de l'analyse comparative et de la prédiction fonctionnelle des données du gène marqueur de l'ARNr 16S, de ii), un module pour l'analyse exploratoire des données, le profilage fonctionnel et la visualisation du réseau métabolique pour les données de métagénomique ou de métatranscriptomique « Shotgun », de iii), un module pour aider les utilisateurs à interpréter leurs taxons d'intérêt par l'analyse d'enrichissement contre notre base de données d'environ 300 ensembles de taxons collectés manuellement à partir de la littérature récente et de bases de données publiques, et de iv), un module pour aider les utilisateurs à explorer visuellement leurs données dans le contexte de données publiques (méta-analyse) pour la découverte de modèles et de connaissances biologiques. L'outil est librement accessible à http://www.microbiomeanalyst.ca

    Similar works

    Full text

    thumbnail-image

    Available Versions