thesis

Kodierung enzymatischer Reaktionen

Abstract

Die Einteilung enzymatischer Reaktionen erfolgt auf Basis des EC-Klassifikationssystems. Die Einordnung neuer Enzyme ist hochkomplex und erfordert die Absprache von verschiedenen Enzymkommissionen der Organisationen IUPAC und IUBMB. Dieses zeitaufwendige Verfahren war die Motivation für die vorliegende Arbeit, ein automatisiertes System für die Charakterisierung enzymatischer Reaktionen zu entwickeln, das auf dem Dugundji-Ugi-Modell basiert. Hierbei werden Reaktionen durch mathematische Operatoren beschrieben, die als Reaktionsmatrizen (R-Matrizen) bezeichnet werden und das Elektronentransfermuster einer Reaktion kodieren. R-Matrizen enthalten die Information, welche Bindungen gespalten werden oder entstehen und welche Atome an der Reaktion beteiligt sind. Das Errechnen der R-Matrizen erfordert allerdings eine Atomzuordnung der Eduktatome auf die Produktatome. Diese Zuordnung wurde in der Vergangenheit immer mit hohem manuellem Aufwand erstellt. Im Rahmen dieser Arbeit wurde ein Programm entwickelt, das die R-Matrizen nur anhand der Edukt- und Produktmoleküle errechnet und ohne manuelle Unterstützung auskommt. Kern des Verfahrens ist ein MCS-Algorithmus (Maximal Common Subgraph), der die maximalen gemeinsamen Substrukturen von 2 Molekülen errechnet. Dieser neu entwickelte Algorithmus ist sehr flexibel und kann daher auch komplexe Veränderungen in der Molekülstruktur nachvollziehen. Er wird dazu verwendet, die Eduktmoleküle mit den Produktmolekülen zu vergleichen. Die maximalen gemeinsamen Substrukturen aus den Molekülvergleichen werden kombiniert und durch ein Rankingsystem bewertet, das alle möglichen Atomzuordnungen errechnet. Bedingt durch die Komplexität vieler biochemischer Reaktionen, war es erforderlich, das Verfahren um weitere Algorithmen zu erweitern, um falsche Zuordnungen zu vermeiden und die Laufzeit zu verbessern. So wurden Verfahren zur Erkennung von lokalen Symmetrien, aromatischen Ringsystemen und Kofaktoren integriert und eine weitere Molekülvergleichsebene eingeführt. Mit Hilfe dieses Systems von verschiedenen Algorithmen wird eine vollständige Atomzuordnung generiert. Auf Grundlage einer vollständigen Atomzuordnung ist die Berechnung der R-Matrizen schließlich sehr einfach. Ein weiteres Problem stellte allerdings der Vergleich der R-Matrizen dar, weil von jeder R-Matrix n! mögliche Permutationen erzeugt werden können. Der Vergleich erfolgt mit Hilfe eines neuen Kanonisierungsalgorithmus, der aus der Vielzahl von Permutationen eine repräsentative R-Matrix selektiert. Die Überführung der R-Matrizen in R-Strings vereinfacht schließlich den Vergleich und die Gruppierung von enzymatischen Reaktionen anhand ihres Elektronentransfermusters. Auf der Grundlage eines Datensets, das 228 der 229 definierten Subsubklassen abdeckt, wurden die R-Matrizen von 3209 enzymatischen Reaktionen automatisch errechnet. Neben der Analyse der R-Matrizen selbst, standen bei der Auswertung die Beziehungen zwischen dem Dugundji-Ugi-Modell und dem EC-Klassifikationssystem im Vordergrund. Als Bezugspunkt wurden die Subsubklassen des EC-Klassifikationssystems gewählt, die bereits soweit spezifiziert sind, dass hier eine hohe Übereinstimmung beider Systeme zu erwarten war. So wurden die Subsubklassen auf ihre Homogenität in ihren Elektronentransfermustern untersucht. Die häufigsten R-Matrizen jeder Subsubklasse wurden verglichen und Subsubklassen mit identischen R-Matrizen gruppiert. Die Elektronentransfermuster innerhalb der Subsubklassen erwiesen sich in der Mehrzahl als homogen. Allerdings wurden auch Subsubklassen mit geringer Übereinstimmung in den Elektronentransfermustern gefunden, für die eine höhere Homogenität erwartet worden wäre. Der R-Matrixvergleich der verschiedenen Subsubklassen ergab, dass 121 Subsubklassen bereits ein spezifisches Elektronentransfermuster besitzen. 107 Subsubklassen bilden hingegen Gruppen verschiedener Größe. Einige Gruppen bestehen aus Subsubklassen von verschiedenen Hauptklassen, obwohl sie nach ihren Elektronentransfermustern einen identischen Reaktionskern besitzen. Die Ergebnisse machen die Eigenschaften des Dugundji-Ugi-Modells deutlich, das sehr rational und unvoreingenommen die wesentlichsten Eigenschaften einer Reaktion beschreibt. Ähnlich, wie das EC-Klassifikationssystem, betrachtet es aber die chemischen Eigenschaften der Gesamtreaktion. Es könnte daher die Enzymklassifikation unterstützen, indem es aufzeigt, welche Subsubklassen feiner untergliedert oder zu größeren Gruppen zusammengefasst werden könnten

    Similar works