3 research outputs found

    Graphenrekonstruktion anhand abhÀngiger Zeitreihen in biologischen Netzwerken

    Get PDF
    Die Biologie befasst sich mit dem Aufbau und der Organisation von Lebewesen. Bei beiden Aspekten finden sich auf verschiedenen Abstraktionsebenen PhĂ€nomene, die sich als Netzwerke interpretieren lassen. Ein makroskopisches Beispiel dafĂŒr sind RĂ€uber-BeuteBeziehungen (z. B. GrĂ¶ĂŸe einer Fuchspopulation in AbhĂ€ngigkeit von ihren Beutetieren wie Kaninchen, HĂŒhnern, etc.). Es ist leicht ersichtlich, dass die GrĂ¶ĂŸen der Populationen jeweils voneinander abhĂ€ngen und eine wechselseitige Dynamik widerspiegeln. Auf molekularer Ebene gibt es ebenfalls Beispiele fĂŒr Interaktionen, die sich ĂŒber ein dynamisches Netzwerk beschreiben lassen, etwa bei zellulĂ€ren Prozessen. Ein Beispiel hierfĂŒr ist die Katalyse einer chemischen Reaktion mittels eines Enzyms. Die Konzentration des Enzyms und der beteiligten Substanzen beeinflussen dabei die Geschwindigkeit, mit welcher der Stoffwechselprozess ablĂ€uft. Mit dieser (makro)molekularen Ebene beschĂ€ftigt sich diese Arbeit. Wie wichtig ein funktionierendes Netzwerk ist, wird deutlich wenn man ein gestörtes System betrachtet, etwa wenn eingeschleppte Arten ein Ökosystem aus dem Gleichgewicht bringen. Ein aktuelles Beispiel dazu ist der amerikanische Kalikokrebs (Orconectes immunis ), der sich derzeit in Europa schnell ausbreitet, da ihm natĂŒrliche Feinde fehlen. Gleichzeitig bedroht er durch seinen Ressourcenverbrauch Tierarten wie Libellen, Amphibien und einheimische Krebse. Auf zellulĂ€rer Ebene kann eine Störung des Netzwerks der DNA-Reparatur und der Zellzykluskontrolle zu der Entstehung von Krebs fĂŒhren. Die DNA-Reparatur stellt ein komplexes System aus verschiedenen Proteinen und DNA dar. Der Ausfall eines Bestandteils dieses Systems kann fĂŒr den Reparaturprozess verheerende Folgen haben. Es wird deutlich wie wichtig das VerstĂ€ndnis der Dynamik dieser Systeme ist, um Analysen und Prognosen fĂŒr den Zustand dieser Systeme zu erstellen. In den beiden genannten Beispielen kann es helfen die Entstehung von Krebs besser vorherzusagen, bzw. bedrohte Tier- und Pflanzenarten zu schĂŒtzen. Anhand von Netzwerken, die die Interaktion von Proteinen, DNA und RNA darstellen, ist das Ziel dieser Arbeit, den messbaren Informationsfluss zwischen verschiedenen beteiligten Elementen zu erkennen und mit dessen Hilfe die Struktur des Netzwerks zu rekonstruieren. Zu diesem Zweck werden die Zeitreihen der einzelnen Knoten mittels verschiedener statistischer und informationstheoretischer Maße miteinander in Beziehung gesetzt. Bei der Auswahl der verschiedenen Maße greife ich sowohl auf klassische statistische Maße (z. B. Korrelationskoeffizienten), als auch auf informationstheoretische (auf Shannon-Entropie basierende) Methoden zurĂŒck, die in den letzten Jahren im Bereich der Biologie populĂ€rer gewordenen sind. Der Vergleich dieser Methoden findet durch mehrere Beispielsysteme statt, die ich in drei verschiedene Kategorien eingeteilt habe. Allen Beispielen gemein ist die zeitliche Simulation, um ein dynamisches, verĂ€nderliches System abzubilden. Mit Hilfe der Messung des Zusammenhangs der einzelnen Knoten ĂŒber die Zeit, soll im Umkehrschluss auf die Topologie des zugrunde liegenden Netzwerks zurĂŒck geschlossen werden. In die erste Kategorie fĂ€llt ein einfaches Differentialgleichungssystem, welches zwei Feedback-Schleifen miteinander koppelt. Die Parametrisierung des Netzwerks sorgt fĂŒr eine stabile Schwingung der beiden Schleifen um ihren jeweiligen Mittelwert. Als nĂ€chste Kategorie werden zwei verschiedene Typen von Zufallsgraphen erzeugt. Der erste wird durch einem von mir entworfenen Algorithmus erstellt, der eine bestimmte Menge an Knoten erzeugt, die mit einer bestimmten Anzahl von Eingangskanten und Ausgangskanten verbunden sind. Der zweite Typus ist ein sogenanntes skalenfreies Netz. Diese Netzwerktopologie kann in vielen Systemen wieder gefunden werden. Dazu gehören sowohl biologische als auch auch digitale soziale Netzwerke. In der letzten Kategorie wende ich die genannten Methoden auf verschiedene Beispiele aus der BioModels Database an. Diese Datenbank bietet sich aufgrund der umfangreichen DatensĂ€tze an und enthĂ€lt viele biochemische Netzwerke, z. B. Protein-ProteinInteraktion, Protein-RNA-Interaktion usw. Abschließend diskutiere ich die vorgelegten Ergebnisse und gebe einen Ausblick auf die Möglichkeiten diese AnsĂ€tze weiter zu verfolgen und auszubauen. Des Weiteren wurden im Zuge dieser Arbeit verschiedene Software Tools von mir entwickelt, bzw. studentische Arbeiten zur Entwicklung betreut, die fĂŒr die DurchfĂŒhrung der hier gezeigten Analysen wichtig waren. Diese werden in einem getrennten Abschnitt besprochen

    Computing and visually analyzing mutual information in molecular co-evolution

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>Selective pressure in molecular evolution leads to uneven distributions of amino acids and nucleotides. In fact one observes correlations among such constituents due to a large number of biophysical mechanisms (folding properties, electrostatics, ...). To quantify these correlations the mutual information -after proper normalization - has proven most effective. The challenge is to navigate the large amount of data, which in a study for a typical protein cannot simply be plotted.</p> <p>Results</p> <p>To visually analyze mutual information we developed a matrix visualization tool that allows different views on the mutual information matrix: filtering, sorting, and weighting are among them. The user can interactively navigate a huge matrix in real-time and search e.g., for patterns and unusual high or low values. A computation of the mutual information matrix for a sequence alignment in FASTA-format is possible. The respective stand-alone program computes in addition proper normalizations for a null model of neutral evolution and maps the mutual information to <it>Z</it>-scores with respect to the null model.</p> <p>Conclusions</p> <p>The new tool allows to compute and visually analyze sequence data for possible co-evolutionary signals. The tool has already been successfully employed in evolutionary studies on HIV1 protease and acetylcholinesterase. The functionality of the tool was defined by users using the tool in real-world research. The software can also be used for visual analysis of other matrix-like data, such as information obtained by DNA microarray experiments. The package is platform-independently implemented in <monospace>Java</monospace> and free for academic use under a GPL license.</p
    corecore