Metabolic models - But without phylogenetical fallacy! The issue and the optimisation of the functional prediction of enzymes and the reconstruction of metabolic models based on phylogeny considering the example of Rhodobacteraceae and archaea.

Abstract

Die Erstellung metabolischer Modelle infolge der Rekonstruktion von Netzwerken enzymkatalysierter Reaktionen des Stoffwechsels eines Organismus ist ein nicht mehr wegzudenkendes systembiologisches Werkzeug. Die Systembiologie verfolgt den Ansatz, mit Hilfe dieser Modelle Organismen und ihre metabolischen Anpassungen in ihrer Gesamtheit zu simulieren und zu analysieren. Eine entscheidende Ausgangsbasis schafft die Enzymfunktionsvorhersage. Hierfür stehen vielfältige Daten und Methoden der Bioinformatik zur Verfügung. Um möglichst einfach fundamentierte Aussagen über den Enzympool eines Organismus treffen und diese Informationen im Sinne der metabolischen Modellerstellung verwenden zu können, wird das Programm EnzymeDetector weiterentwickelt. Somit kann durch die Aggregation der Informationen von automatisierten Annotationsdatenbanken und manuell geprüfter, experimentell beschriebener Enzymfunktionen eine umfassende Sammlung genomweiter Funktionsvorhersagen von über 3000 Organismen erstellt werden. Unterstützung bei der Entscheidung für die wahrscheinlichste Genfunktion bieten Algorithmen auf Basis von Sequenzvergleichen mittels BLAST, Pfam-Proteinfamilien und Sequenzmustern. Die Darstellung des Metabolismus ganzer phylogenetischer Kladen wird somit erleichtert und es werden am Beispiel der Rhodobacteraceen und der Archaeen Zusammenhänge der Enzymausstattung zu diversen mikrobiellen Eigenschaften interpretiert. Zusätzlich werden diese Aussagen im Kontext ganzer Stoffwechselwege und deren enzymatischen Schlüsselfunktionen und Alternativreaktionen analysiert. Die Interpretationen der Ergebnisse analysieren durch den Vergleich der phylogenetischen Verwandtschaftsverhältnisse auf Grundlage der 16S rRNA und der Distanzen der jeweiligen Enzym- und Stoffwechselwegpools kritisch die Diversität des Metabolismus der Organismengruppen und somit die Basis einer weit verbreiteten Methode der Funktionsvorhersage ohne expliziten Sequenznachweis. Andererseits werden domänentypische und mit mikrobiellen Eigenschaften verknüpfte Enzymklassen beschrieben, die regulatorische, sensorische, oder strukturelle Funktionen und Mechanismen katalysieren, bzw. den Bezug der Organismen zu ihrem jeweiligen Habitat charakterisieren und differenzieren.Generating metabolic models of an organism is a highly important tool in Systems Biology. With these models the Systems Biology follows the approach to simulate and analyze organisms and their metabolic adaptations to the environment. The enzyme function prediction offers an important basis. Multiple databases and bioinformatic methods are available for the reconstruction. In order to predict the enzyme pool of an organism as fast and precise as possible and in order to use these informations in the sense of metabolic model reconstruction the tool EnzymeDetector is further developed. An extensive collection of genome-wide function predictions of more than 3000 organisms can be created by aggregating the information of automated annotation databases and manually revised or experimentally described functions. Further developed algorithms based on sequence comparisons with BLAST, Pfam and patternsearches support the decision for the most probable enzyme function. The EnzymeDetector simplifies the building of models and the representation of the metabolism of phylogenetic clades. Furthermore, the connections between an organism's enzyme pool and the diverse microbial characteristics are interpreted by considering the example of Rhodobacteraceae and archaea. Additionally, these information is analyzed in the context of whole pathways and their enzymatic key functions and alternative reactions. The interpretations of the results analyze the diversity of the organisms' metabolism and the base for the wide spread method of function prediction without explicit sequence evidence by comparison of the phylogenetic relationship based on the 16S rRNA and the distances of the enzyme and pathway pools. Moreover, enzymes are described which are either domain specific or connected to microbial properties and catalyze regulatory, sensoric, or structural functions and mechanisms or characterize the relationship of the organisms and their respective habitat in a metabolic context

    Similar works