8 research outputs found
Deep metagenome and metatranscriptome analyses of microbial communities affiliated with an industrial biogas fermenter, a cow rumen, and elephant feces reveal major differences in carbohydrate hydrolysis strategies
Additional file 4. Compressed rar file containing the bins generated from the biogas fermenter metagenome, part 4 of 4
Resources for the analysis of bacterial and microbial genomic data with a focus on antibiotic resistance
Antibiotics are drugs which inhibit the growth of bacterial cells. Their
discovery was one of the most significant achievements in medicine:
it allowed the development of successful treatment options for severe
bacterial infections, which has helped to significantly increase our life
expectancy. However, bacteria have the ability to adapt to changing
environmental conditions through genetic modifications, and can,
therefore, become resistant to an antibiotic. Extensive use of antibiotics
promotes the development of antibiotic resistance and, since
some genetic factors can be exchanged between the cells, emergence
of new resistance mechanisms and their spread have become a serious
global problem.
Counteractive measures have been initiated, focusing on the different
factors contributing to the antibiotic resistance crisis. These
include the study of bacterial isolates and complete microbial communities
using whole-genome sequencing (WGS) data. In both cases,
there are specific challenges and requirements for different analytical
approaches. The goal of the present thesis was the implementation
of multiple resources which should facilitate further microbiological
studies, with a focus on bacteria and antibiotic resistance. The main
project, GEAR-base, included an analysis of WGS and resistance data
of around eleven thousand bacterial clinical isolates covering the main
human pathogens and antibiotics from different drug classes. The
dataset consisted of WGS data, antibiotic susceptibility profiles and
meta-information, along with additional taxonomic characterization
of a sample subset. The analysis of this isolate collection allowed
for the identification of bacterial species demonstrating increasing
resistance rates, to construct species pan-genomes from the de novo
assembled genomes, and to link gene presence or absence to the
available antibiotic resistance profiles. The generated data and results
were made available through the online resource GEAR-base. This
resource provides access to the resistance information and genomic
data, and implements functionality to compare submitted genes or
genomes to the data included in the resource.
In microbial community studies, the metagenome obtained through
WGS is analyzed to determine its taxonomic composition. For this
task, genomic sequences are clustered, or binned, to represent sequences
belonging to specific organisms or closely-related organism
groups. BusyBee Web was developed to provide an automatic binning
pipeline using frequencies of k-mers (subsequences of length k)
and bootstrapped supervised clustering. It also includes further data
annotation, such as taxonomic classification of the input sequences,
presence of know resistance factors, and bin quality.
Plasmids, extra-chromosomal DNA molecules found in some bacteria,
play an important role in antibiotic resistance spread. As
the classification of sequences from WGS data as chromosomal or
plasmid-derived is challenging, demonstrated by evaluating four tools
implementing three different approaches, having a reference dataset
to detect the plasmids which are already known is therefore desirable.
To this end, an online resource for complete bacterial plasmids
(PLSDB) was implemented.
In summary, the herein described online resources represent valuable
datasets and/or tools for the analysis of microbial genomic data
and, especially, bacterial pathogens and antibiotic resistance.Antibiotika sind Medikamente, die das Wachstum von Bakterienzellen
hemmen. Ihre Entdeckung war eine der bedeutendsten Leistungen
der Medizin: Es erlaubte die Entwicklung von erfolgreichen
Behandlungsmöglichkeiten von schwerwiegenden bakteriellen Infektionen,
was geholfen hat, unsere Lebenserwartung zu erhöhen. Allerdings
sind Bakterien in der Lage sich den wechselnden Umweltbedingungen
anzupassen und können dadurch resistent gegen ein Antibiotikum
werden. Der extensive Gebrauch von Antibiotika fördert die Entwicklung
von Antibiotikaresistenzen und, da einige genetische Faktoren
zwischen den Zellen ausgetauscht werden können, sind das Auftauchen
von neuen Resistenzmechanismen und deren Verbreitung zu
einem seriösen globalen Problem geworden.
Gegenmaßnahmen wurden ergriffen, die sich auf die verschiedenen
Faktoren fokussieren, die zur Antibiotikaresistenzkrise beitragen.
Diese umfassen Studien von bakteriellen Isolaten und ganzen
Mikrobengemeinschaften mithilfe von Gesamt-Genom-Sequenzierung
(GGS). In beiden Fällen gibt es spezifische Herausforderungen und
Bedürfnisse für verschiedene analytische Methoden. Das Ziel dieser
Dissertation war die Implementierung von mehreren Ressourcen, die
weitere mikrobielle Studien erleichtern sollen und einen Fokus auf
Bakterien und Antibiotikaresistenz haben. Das Hauptprojekt, GEAR-base,
beinhaltete eine Analyse von GGS- und Resistenzdaten von
ungefähr elftausend klinischen Bakterienisolaten und umfasste die
wichtigen menschlichen Pathogene und Antibiotika aus verschiedenen
Medikamentenklassen. Neben den GGS-Daten, Empfindlichkeitsprofilen
für die Antibiotika und Metainformation, beinhaltete der
Datensatz zusätzliche taxonomische Charakterisierung von einer Teilmenge
der Proben. Die Analyse dieser Sammlung an Isolaten erlaubte
die Identifizierung von Spezies mit ansteigenden Resistenzraten, die
Konstruktion von den Spezies-Pan-Genomen aus den de novo assemblierten
Genomen und die Verknüpfung vom Vorhandensein oder
Fehlen von Genen mit den Antibiotikaresistenzprofilen. Die generierten
Daten und Ergebnisse wurden durch die Online-Ressource
GEAR-base bereitgestellt. Diese Ressource bietet Zugang zur Resistenzinformation
und den gesammelten genomischen Daten und
implementiert Funktionen zum Vergleich von hochgeladenen Genen
oder Genomen zu den Daten, die in der Ressource enthalten sind.
In den Studien von Mikrobengemeinschaften wird das durch GGS
erhaltene Metagenom analysiert, um seine taxonomische Zusammensetzung
zu bestimmen. Dafür werden die genomischen Sequenzen
in sogenannte Bins gruppiert (Binning), die die Zugehörigkeit
von den Sequenzen zu bestimmten Organismen oder zu Gruppen von
nah verwandten Organismen repräsentieren. BusyBee Web wurde entwickelt,
um eine automatische Binning-Pipeline anzubieten, die die
Häufigkeitsprofile von k-meren (Teilsequenzen der Länge k) und eine
auf dem Bootstrap-Verfahren basierte Methode für die Gruppierung
der Sequenzen nutzt. Zusätzlich wird eine Annotation der Daten
durchgeführt, wie die taxonomische Klassifizierung der hochgeladenen
Sequenzen, das Vorhandensein von bekannten Resistenzfaktoren
und die Qualität der Bins.
Plasmide, DNA-Moleküle, die zusätzlich zum Chromosom in einigen
Bakterien vorhanden sind, spielen eine wichtige Rolle in der
Verbreitung von Antibiotikaresistenzen. Die Klassifizierung von Sequenzen
aus der GGS als von einem Chromosom oder einem Plasmid
stammend ist herausfordernd, wie es in einer Evaluation von vier
Tools, die drei verschiedene Ansätze implementieren, demonstriert
wurde. Deshalb ist das Vorhandensein von einem Referenzdatensatz,
um schon bekannte Plasmide zu detektieren, sehr wünschenswert.
Zu diesem Zweck wurde eine Online-Ressource von vollständigen
bakteriellen Plasmiden implementiert (PLSDB).
Die hier beschriebenen Online-Ressourcen stellen nützliche Datensätze
und/oder Werkzeuge dar, die für die Analyse von mikrobiellen
genomischen Daten, insbesondere von bakteriellen Pathogenen und
Antibiotikaresistenzen, eingesetzt werden können
Recommended from our members
Elviz - exploration of metagenome assemblies with an interactive visualization tool.
BackgroundMetagenomics, the sequencing of DNA collected from an entire microbial community, enables the study of natural microbial consortia in their native habitats. Metagenomics studies produce huge volumes of data, including both the sequences themselves and metadata describing their abundance, assembly, predicted functional characteristics and environmental parameters. The ability to explore these data visually is critically important to meaningful biological interpretation. Current genomics applications cannot effectively integrate sequence data, assembly metadata, and annotation to support both genome and community-level inquiry.ResultsElviz (Environmental Laboratory Visualization) is an interactive web-based tool for the visual exploration of assembled metagenomes and their complex metadata. Elviz allows scientists to navigate metagenome assemblies across multiple dimensions and scales, plotting parameters such as GC content, relative abundance, phylogenetic affiliation and assembled contig length. Furthermore Elviz enables interactive exploration using real-time plot navigation, search, filters, axis selection, and the ability to drill from a whole-community profile down to individual gene annotations. Thus scientists engage in a rapid feedback loop of visual pattern identification, hypothesis generation, and hypothesis testing.ConclusionsCompared to the current alternative of generating a succession of static figures, Elviz can greatly accelerate the speed of metagenome analysis. Elviz can be used to explore both user-submitted datasets and numerous metagenome studies publicly available at the Joint Genome Institute (JGI). Elviz is freely available at http://genome.jgi.doe.gov/viz and runs on most current web-browsers
Elviz - exploration of metagenome assemblies with an interactive visualization tool.
BackgroundMetagenomics, the sequencing of DNA collected from an entire microbial community, enables the study of natural microbial consortia in their native habitats. Metagenomics studies produce huge volumes of data, including both the sequences themselves and metadata describing their abundance, assembly, predicted functional characteristics and environmental parameters. The ability to explore these data visually is critically important to meaningful biological interpretation. Current genomics applications cannot effectively integrate sequence data, assembly metadata, and annotation to support both genome and community-level inquiry.ResultsElviz (Environmental Laboratory Visualization) is an interactive web-based tool for the visual exploration of assembled metagenomes and their complex metadata. Elviz allows scientists to navigate metagenome assemblies across multiple dimensions and scales, plotting parameters such as GC content, relative abundance, phylogenetic affiliation and assembled contig length. Furthermore Elviz enables interactive exploration using real-time plot navigation, search, filters, axis selection, and the ability to drill from a whole-community profile down to individual gene annotations. Thus scientists engage in a rapid feedback loop of visual pattern identification, hypothesis generation, and hypothesis testing.ConclusionsCompared to the current alternative of generating a succession of static figures, Elviz can greatly accelerate the speed of metagenome analysis. Elviz can be used to explore both user-submitted datasets and numerous metagenome studies publicly available at the Joint Genome Institute (JGI). Elviz is freely available at http://genome.jgi.doe.gov/viz and runs on most current web-browsers