7 research outputs found

    MetNet: Systems Biology Tools for Arabidopsis

    Get PDF
    MetNet (http://metnetdb.org) is an emerging open-source software platform for exploration of disparate experimental data types and regulatory and metabolic networks in the context of Arabidopsis systems biology. The MetNet platform features graph visualization, interactive displays, graph theoretic computations for determining biological distances, a unique multivariate display and statistical analysis tool, graph modeling using the open source statistical analysis language, R, and versatile text mining. The use of these tools is illustrated with data from the bio1 mutant of Arabidopsis

    Algebraic comparison of metabolic networks, phylogenetic inference, and metabolic innovation

    Get PDF
    BACKGROUND: Comparison of metabolic networks is typically performed based on the organisms' enzyme contents. This approach disregards functional replacements as well as orthologies that are misannotated. Direct comparison of the structure of metabolic networks can circumvent these problems. RESULTS: Metabolic networks are naturally represented as directed hypergraphs in such a way that metabolites are nodes and enzyme-catalyzed reactions form (hyper)edges. The familiar operations from set algebra (union, intersection, and difference) form a natural basis for both the pairwise comparison of networks and identification of distinct metabolic features of a set of algorithms. We report here on an implementation of this approach and its application to the procaryotes. CONCLUSION: We demonstrate that metabolic networks contain valuable phylogenetic information by comparing phylogenies obtained from network comparisons with 16S RNA phylogenies. The algebraic approach to metabolic networks is suitable to study metabolic innovations in two sets of organisms, free living microbes and Pyrococci, as well as obligate intracellular pathogens

    A novel algorithm for detecting differentially regulated paths based on gene set enrichment analysis

    Get PDF
    Motivation: Deregulated signaling cascades are known to play a crucial role in many pathogenic processes, among them are tumor initiation and progression. In the recent past, modern experimental techniques that allow for measuring the amount of mRNA transcripts of almost all known human genes in a tissue or even in a single cell have opened new avenues for studying the activity of the signaling cascades and for understanding the information flow in the networks

    Gradient Descent Optimization in Gene Regulatory Pathways

    Get PDF
    BACKGROUND: Gene Regulatory Networks (GRNs) have become a major focus of interest in recent years. Elucidating the architecture and dynamics of large scale gene regulatory networks is an important goal in systems biology. The knowledge of the gene regulatory networks further gives insights about gene regulatory pathways. This information leads to many potential applications in medicine and molecular biology, examples of which are identification of metabolic pathways, complex genetic diseases, drug discovery and toxicology analysis. High-throughput technologies allow studying various aspects of gene regulatory networks on a genome-wide scale and we will discuss recent advances as well as limitations and future challenges for gene network modeling. Novel approaches are needed to both infer the causal genes and generate hypothesis on the underlying regulatory mechanisms. METHODOLOGY: In the present article, we introduce a new method for identifying a set of optimal gene regulatory pathways by using structural equations as a tool for modeling gene regulatory networks. The method, first of all, generates data on reaction flows in a pathway. A set of constraints is formulated incorporating weighting coefficients. Finally the gene regulatory pathways are obtained through optimization of an objective function with respect to these weighting coefficients. The effectiveness of the present method is successfully tested on ten gene regulatory networks existing in the literature. A comparative study with the existing extreme pathway analysis also forms a part of this investigation. The results compare favorably with earlier experimental results. The validated pathways point to a combination of previously documented and novel findings. CONCLUSIONS: We show that our method can correctly identify the causal genes and effectively output experimentally verified pathways. The present method has been successful in deriving the optimal regulatory pathways for all the regulatory networks considered. The biological significance and applicability of the optimal pathways has also been discussed. Finally the usefulness of the present method on genetic engineering is depicted with an example

    Structural modelling and robustness analysis of complex metabolic networks and signal transduction cascades

    Get PDF
    The dissertation covers the topic of structural robustness of metabolic networks on the basis of the concept of elementary flux modes (EFMs). It is shown that the number of EFMs does not reflect the topology of a network sufficiently. Thus, new methods are developed to determine the structural robustness of metabolic networks. These methods are based on systematic in-silico knockouts and the subsequent calculation of dropped out EFMs. Thereby, together with single knockouts also double and multiple knockouts can be used. After evaluation of these methods they are applied to metabolic networks of human erythrocyte and hepatocyte as well as to a metabolic network of Escherichia coli (E. coli). It is found that the erythrocyte has the lowest structural robustness, followed by the hepatocyte and E. coli. These results coincide very well with the circumstance that human erythrocyte and hepatocyte and E. coli are able to adapt to conditions with increasing diversity. In a further part of the dissertation the concept of EFMs is expanded to signal transduction pathways consisting of kinase cascades. The concept of EFMs is based on the steady-state condition for metabolic pathways. It is shown that under certain circumstances this steady-state condition also holds for signalling cascades. Furthermore, it is shown that it is possible to deduce minimal conditions for signal transduction without knowledge about the kinetics involved. On the basis of these assumptions it is possible to calculate EFMs for signalling cascades. But due to the fact that these EFMs do no longer just have mass flux but also information flux, they are now called elementary signalling modes (ESMs).Die Dissertation behandelt die strukturelle Robustheit von metabolischen Netzwerken auf der Basis des Konzepts der elementaren Flussmoden (EFMen). Es wird gezeigt, dass die Anzahl der EFMen die Topologie eines metabolischen Netzes nicht ausreichend widerspiegelt. Darauf aufbauend werden neue Methoden entwickelt, um die strukturelle Robustheit metabolischer Netze zu bestimmen. Diese Methoden beruhen auf systematischen in-silico-Knockouts und der anschließenden Bestimmung des Anteils an weggefallenen EFMen. Dabei können neben Einfach-Knockouts auch Doppel- oder Mehrfach-Knockouts verwendet werden. Nach der Evaluierung werden diese Methoden auf metabolische Netzwerke des menschlichen Erythrozyten und Hepatozyten, sowie des Bakteriums Escherichia coli (E. coli) angewendet. Es zeigt sich, dass der Erythrozyt die im Vergleich geringste strukturelle Robustheit besitzt, gefolgt vom Hepatozyten und E. coli. Diese Ergebnisse stimmen sehr gut mit der Beobachtung überein, dass sich die menschlichen Erythrozyten und Hepatozyten, sowie E. coli an zunehmend verschiedene Bedingungen anpassen können. In einem weiteren Teil der Dissertation wird das Konzept der EFMen auf Signaltransduktionswege bestehend aus Kinase-Kaskaden erweitert. Das Konzept der EFMen beruht auf der Annahme eines quasi-stationären Zustands für metabolische Netzwerke. Es wird gezeigt, dass dieser quasi-stationäre Zustand unter bestimmten Bedingungen auch in Signal-Kaskaden angenommen werden kann. Weiterhin wird gezeigt, dass man ohne Kenntnis der beteiligten Kinetiken Minimalbedingungen für die Signalweiterleitung ableiten kann. Auf Basis dieser Annahmen lassen sich für Signal-Kaskaden EFMen berechnen. Aber aufgrund der Tatsache, dass sie nicht mehr nur Masse-, sondern auch Informationsfluss beschreiben, werden sie nun als elementare Signalmoden (ESMen) bezeichnet

    Computational analysis of alternative splicing in human and mice

    Get PDF
    Im ersten Teil wurden Transkript-Spleißstellen untersucht, mit dem Ziel, alternative und Referenzspleißstellen zu unterscheiden. Die Ergebnisse belegen, dass sich beide Klassen von Spleißstellen durch einen Spleißstellen-Score und vermehrtes Auftreten von Spleißfaktor-Bindemotiven in Umgebung der Spleißstellen abgrenzen lassen. Zusätzlich konnte eine positive Korrelation zwischen der Häufigkeit der Nutzung bestimmter Spleißstellen und dem Spleißstellen-Score in beiden Vergleichsklassen nachgewiesen werden. Diese Abhängigkeit impliziert, dass die Genauigkeit der Annotation alternativer Spleißvarianten mit der Anzahl beobachteter Transkripte steigt. Im zweiten Teil wurde das Spleißsignalmotiv GYNNGY untersucht, welches mehr als 40% aller überlappenden Donor-Spleißsignale ausmacht. Mittels in silico Analysen und experimenteller Validierung wurde die Plausibilität dieses subtilen Spleißmusters bestätigt. Der Vergleich mit anderen humanen Spleißvarianten sowie mit Tandem Donoren in Maus-Transkripten zeigte zudem ausgeprägte Unterschiede bezüglich des Spleißstellen-Scores, der Konservierung, sowie dem Vorkommen von Spleißfaktoren-Bindemotiven. Die Verschiebung des Leserasters durch alternatives Spleißen an GYNNGY-Donoren lässt auf eine komplexe Rolle im RNA-Reifungsprozess schließen. Im dritten Teil wurden Reaktionen des spleißosomalen Makrokomples aus publizierten, experimentellen Daten zusammengestellt und mit Hilfe der Petri-Netz-Theorie in einem qualitativen Modell dargestellt. Unter Annahme eines Steady-State Systems wurden minimale, semipositive T-Invarianten berechnet und zur Validierung des Modells herangezogen. Auf Grundlage der vollständigen Abdeckung des Reaktionsnetzwerks mit T-Invarianten konnten weitere Strukturmerkmale, wie Maximal-Gemeinsame Transitions.Mengen und T-Cluster berechnet werden, welche wichtige Stadien des Spleißosomaufbaus widerspiegeln

    Clustering of scientific fields by integrating text mining and bibliometrics.

    Get PDF
    De toenemende verspreiding van wetenschappelijke en technologische publicaties via het internet, en de beschikbaarheid ervan in grootschalige bibliografische databanken, leiden tot enorme mogelijkheden om de wetenschap en technologie in kaart te brengen. Ook de voortdurende toename van beschikbare rekenkracht en de ontwikkeling van nieuwe algoritmen dragen hiertoe bij. Belangrijke uitdagingen blijven echter bestaan. Dit proefschrift bevestigt de hypothese dat de nauwkeurigheid van zowel het clusteren van wetenschappelijke kennisgebieden als het classificeren van publicaties nog verbeterd kunnen worden door het integreren van tekstontginning en bibliometrie. Zowel de tekstuele als de bibliometrische benadering hebben voor- en nadelen, en allebei bieden ze een andere kijk op een corpus van wetenschappelijke publicaties of patenten. Enerzijds is er een schat aan tekstinformatie aanwezig in dergelijke documenten, anderzijds vormen de onderlinge citaties grote netwerken die extra informatie leveren. We integreren beide gezichtspunten en tonen hoe bestaande tekstuele en bibliometrische methoden kunnen verbeterd worden. De dissertatie is opgebouwd uit drie delen: Ten eerste bespreken we het gebruik van tekstontginningstechnieken voor informatievergaring en voor het in kaart brengen van kennis vervat in teksten. We introduceren en demonstreren het raamwerk voor tekstontginning, evenals het gebruik van agglomeratieve hiërarchische clustering. Voorts onderzoeken we de relatie tussen enerzijds de performantie van het clusteren en anderzijds het gewenste aantal clusters en het aantal factoren bij latent semantische indexering. Daarnaast beschrijven we een samengestelde, semi-automatische strategie om het aantal clusters in een verzameling documenten te bepalen. Ten tweede behandelen we netwerken die bestaan uit citaties tussen wetenschappelijke documenten en netwerken die ontstaan uit onderlinge samenwerkingsverbanden tussen auteurs. Dergelijke netwerken kunnen geanalyseerd worden met technieken van de bibliometrie en de grafentheorie, met als doel het rangschikken van relevante entiteiten, het clusteren en het ontdekken van gemeenschappen. Ten derde tonen we de complementariteit aan van tekstontginning en bibliometrie en stellen we mogelijkheden voor om beide werelden op correcte wijze te integreren. De performantie van ongesuperviseerd clusteren en van classificeren verbetert significant door het samenvoegen van de tekstuele inhoud van wetenschappelijke publicaties en de structuur van citatienetwerken. Een methode gebaseerd op statistische meta-analyse behaalt de beste resultaten en overtreft methoden die enkel gebaseerd zijn op tekst of citaties. Onze geïntegreerde of hybride strategieën voor informatievergaring en clustering worden gedemonstreerd in twee domeinstudies. Het doel van de eerste studie is het ontrafelen en visualiseren van de conceptstructuur van de informatiewetenschappen en het toetsen van de toegevoegde waarde van de hybride methode. De tweede studie omvat de cognitieve structuur, bibliometrische eigenschappen en de dynamica van bio-informatica. We ontwikkelen een methode voor dynamisch en geïntegreerd clusteren van evoluerende bibliografische corpora. Deze methode vergelijkt en volgt clusters doorheen de tijd. Samengevat kunnen we stellen dat we voor de complementaire tekst- en netwerkwerelden een hybride clustermethode ontwerpen die tegelijkertijd rekening houdt met beide paradigma's. We tonen eveneens aan dat de geïntegreerde zienswijze een beter begrip oplevert van de structuur en de evolutie van wetenschappelijke kennisgebieden.SISTA;
    corecore