7 research outputs found

    Protein Complexes are Central in the Yeast Genetic Landscape

    Get PDF
    If perturbing two genes together has a stronger or weaker effect than expected, they are said to genetically interact. Genetic interactions are important because they help map gene function, and functionally related genes have similar genetic interaction patterns. Mapping quantitative (positive and negative) genetic interactions on a global scale has recently become possible. This data clearly shows groups of genes connected by predominantly positive or negative interactions, termed monochromatic groups. These groups often correspond to functional modules, like biological processes or complexes, or connections between modules. However it is not yet known how these patterns globally relate to known functional modules. Here we systematically study the monochromatic nature of known biological processes using the largest quantitative genetic interaction data set available, which includes fitness measurements for ∌5.4 million gene pairs in the yeast Saccharomyces cerevisiae. We find that only 10% of biological processes, as defined by Gene Ontology annotations, and less than 1% of inter-process connections are monochromatic. Further, we show that protein complexes are responsible for a surprisingly large fraction of these patterns. This suggests that complexes play a central role in shaping the monochromatic landscape of biological processes. Altogether this work shows that both positive and negative monochromatic patterns are found in known biological processes and in their connections and that protein complexes play an important role in these patterns. The monochromatic processes, complexes and connections we find chart a hierarchical and modular map of sensitive and redundant biological systems in the yeast cell that will be useful for gene function prediction and comparison across phenotypes and organisms. Furthermore the analysis methods we develop are applicable to other species for which genetic interactions will progressively become more available

    A quantitative analysis of monochromaticity in genetic interaction networks

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>A genetic interaction refers to the deviation of phenotypes from the expected when perturbing two genes simultaneously. Studying genetic interactions help clarify relationships between genes, such as compensation and masking, and identify gene groups of functional modules. Recently, several genome-scale experiments for measuring quantitative (positive and negative) genetic interactions have been conducted. The results revealed that genes in the same module usually interact with each other in a consistent way (pure positive or negative); this phenomenon was designated as monochromaticity. Monochromaticity might be the underlying principle that can be utilized to unveil the modularity of cellular networks. However, no appropriate quantitative measurement for this phenomenon has been proposed.</p> <p>Results</p> <p>In this study, we propose the monochromatic index (MCI), which is able to quantitatively evaluate the monochromaticity of potential functional modules of genes, and the MCI was used to study genetic landscapes in different cellular subsystems. We demonstrated that MCI not only amend the deficiencies of MP-score but also properly incorporate the background effect. The results showed that not only within-complex but also between-complex connections present significant monochromatic tendency. Furthermore, we also found that significantly higher proportion of protein complexes are connected by negative genetic interactions in metabolic network, while transcription and translation system adopts relatively even number of positive and negative genetic interactions to link protein complexes.</p> <p>Conclusion</p> <p>In summary, we demonstrate that MCI improves deficiencies suffered by MP-score, and can be used to evaluate monochromaticity in a quantitative manner. In addition, it also helps to unveil features of genetic landscapes in different cellular subsystems. Moreover, MCI can be easily applied to data produced by different types of genetic interaction methodologies such as Synthetic Genetic Array (SGA), and epistatic miniarray profile (E-MAP).</p

    Analyse und Visualisierung von Effekten in genomweiten Expressionsdaten

    Get PDF
    Einleitung: Modell-basierte Vorhersagen fĂŒr molekulare Netzwerke und zellulĂ€re Interaktionen können durch zwei verschiedene Strategien der Systembiologie getroffen werden, die top-down und bottom-up Strategien. Die bottom-up Strategie beginnt bei a priori Wissen ĂŒber einzelne Grundelemente und fĂŒgt diese zu grĂ¶ĂŸeren Einheiten wie Signalwegen oder ganzen Systemen zusammen. Top-down Strategien setzen bei DatensĂ€tzen eines Systems an und versuchen Netzwerke, Interaktionen oder Komponenten zu identifizieren, die fĂŒr das Systemverhalten (z.B. PhĂ€notyp) verantwortlich sind. Im Folgenden werden beide Strategien auf unterschiedliche Transkriptionsdaten angewendet und die Ergebnisse visualisiert. Beide Strategien können auf linearen Regressionsmodellen basieren. In dieser Arbeit werden lineare Regressionsmodelle höherer Ordnung mittels eines neuen visuellen Hilfsmittels, des Eruptionsdiagramms, verglichen. Methodik: Eruptionsdiagramme werden durch die Überlagerung zweier Vulkandiagramme erstellt. Beide Vulkandiagramme werden von derselben Datengrundlage generiert, stammen jedoch von zwei verschiedenen Modellen. Jedes Gen wird von einem Pfeil reprĂ€sentiert, welcher bei dem Punkt des Vulkandiagramms von Modell 1 startet und bei dem Punkt des Vulkandiagramms aus Modell 2 endet. Im Rahmen der Modellselektion können Eruptionsdiagramme als visuelles Hilfsmittel verwendet werden, um (ir)relevante Kovariaten, Störfaktoren und Effektmodifikation aufzudecken. Ergebnisse: Es werden zwei verschiedene TranskriptionsdatensĂ€tze analysiert: ein Maus-Infektionsdatensatz und ein humaner Asthmadatensatz. FĂŒr die Analyse des Infektionsdatensatzes werden verschiedene lineare Regressionsmodelle miteinander verglichen. Durch eine rĂŒckwĂ€rts-gewandte Modellselektionsstrategie wird gezeigt, dass durch die Infektionskovariaten erster Ordnung zusĂ€tzliche erklĂ€rende Kraft gewonnen wird. Durch das Eruptionsdiagramm werden Effekte zweiter Ordnung aufgedeckt. Ein Modellvergleich identifiziert die Kovariaten dritter Ordnung als Störfaktoren. Das Modell zweiter Ordnung, welches am besten zu den Daten passt, wird fĂŒr die weiterfĂŒhrende Analyse verwendet. Die Ergebnisse der Interaktionskovariate werden in aggravating und alleviating Effekte unterteilt. Ein Interaktionseffekt ist alleviating (aggravating, neutral), falls der Effekt der kombinierten Kovariaten schwĂ€cher (stĂ€rker, identisch) als die Summe der individuellen Effekte dieser Kovariaten ist. Bei der bottom-up Analyse des Asthmadatensatzes werden die Daten nicht auf Einzelgenebene sondern auf Gengruppenebene analysiert. ZunĂ€chst wird das passende Regressionsmodell mit Hilfe des Eruptionsdiagramms aufgestellt. Der Einfluss der einzelnen Gene auf das globale Testergebnis der Gengruppen wird in diagnostischen Balkendiagrammen genauer untersucht. Eine Signalweganalyse der Gengruppen zeigt neue Biomarker und Signalwege fĂŒr die Charakterisierung von allergischem und nicht-allergischem Asthma auf. Diskussion: Die Ergebnisse der Transkriptionsanalyse werden durch Anreicherungsanalysen auf ihre funktionelle Relevanz hin untersucht. Die Ergebnisse zeigten unterschiedliche funktionelle Eigenschaften der aggravating und alleviating Gene auf. Die Anreicherungsanalyse des Asthmadatensatzes der Gene, die von Störfaktoren beeinflusst werden und durch Effektmodifikation gekennzeichnet sind, weisen jedoch keine funktionellen Unterschiede auf.Introduction: Model-based prediction of molecular networks and cellular interactions can be identified by two different strategies of systems biology, top-down and bottom-up strategies. The bottom-up strategy starts at a priori knowledge about single elements and merges into more complex units like signalling pathways or whole systems. Top-down strategies explore datasets of a system and try to identify networks, interactions or components responsible for the system behaviour (i.e. phenotype). In this thesis both strategies are applied to different transcription datasets and the corresponding results are visualized. The strategies can be based on linear regression models. In this work higher order regression models are compared using a new visual tool, the eruption plot. Methods: Eruption plots are generated by overlapping two volcano plots. Both volcano plots are based on the same data, but originate from two different models. Each gene is symbolized by an arrow, which connects the point from the volcano plot of the first model to the point from the volcano plot of the second model. The eruption plot is a visual supporting tool in model selection revealing (ir)relevant covariates, confounding factors and effect modification. Results: Two different transcription datasets are analysed in this work, a mouse-infection dataset and a human asthma dataset. For the analysis of the infection dataset two different linear regression models are being compared. As part of a backward driven model selection strategy the infection covariates provide additional explanatory power. The eruption plot highlights second order effects. A model comparison reveals third order covariates as confounding factors. The second order model that matches the data best is applied in the subsequent analysis. The results of the interaction covariates are divided into aggravating and alleviating effects. An interaction effect is alleviating (aggravating, neutral) if the effect of both covariates is lower (higher, identical) than the sum of both individual effects of these covariates. Within the bottom-up analysis of the asthma dataset the genes are not analysed on the single gene level but on the level of gene groups. By application of an eruption plot the adequate regression model is selected. Diagnostic bar plots help to further investigate the influence of the single gene on the global test result of the gene group. A pathway analysis of the gene groups shows new biomarkers and signalling pathways to characterize allergic and non-allergic asthma. Discussion: The functional relevance of both types of analysis is explored in detail through enrichment analysis. The results of the aggravating and alleviating genes show distinct functional properties. Genes of the asthma dataset are divided into genes influenced by confounding factors and effect modification. The enrichment analysis of these two groups, however, reveals no functional differences

    Analyse und Visualisierung von Effekten in genomweiten Expressionsdaten

    Get PDF
    Einleitung: Modell-basierte Vorhersagen fĂŒr molekulare Netzwerke und zellulĂ€re Interaktionen können durch zwei verschiedene Strategien der Systembiologie getroffen werden, die top-down und bottom-up Strategien. Die bottom-up Strategie beginnt bei a priori Wissen ĂŒber einzelne Grundelemente und fĂŒgt diese zu grĂ¶ĂŸeren Einheiten wie Signalwegen oder ganzen Systemen zusammen. Top-down Strategien setzen bei DatensĂ€tzen eines Systems an und versuchen Netzwerke, Interaktionen oder Komponenten zu identifizieren, die fĂŒr das Systemverhalten (z.B. PhĂ€notyp) verantwortlich sind. Im Folgenden werden beide Strategien auf unterschiedliche Transkriptionsdaten angewendet und die Ergebnisse visualisiert. Beide Strategien können auf linearen Regressionsmodellen basieren. In dieser Arbeit werden lineare Regressionsmodelle höherer Ordnung mittels eines neuen visuellen Hilfsmittels, des Eruptionsdiagramms, verglichen. Methodik: Eruptionsdiagramme werden durch die Überlagerung zweier Vulkandiagramme erstellt. Beide Vulkandiagramme werden von derselben Datengrundlage generiert, stammen jedoch von zwei verschiedenen Modellen. Jedes Gen wird von einem Pfeil reprĂ€sentiert, welcher bei dem Punkt des Vulkandiagramms von Modell 1 startet und bei dem Punkt des Vulkandiagramms aus Modell 2 endet. Im Rahmen der Modellselektion können Eruptionsdiagramme als visuelles Hilfsmittel verwendet werden, um (ir)relevante Kovariaten, Störfaktoren und Effektmodifikation aufzudecken. Ergebnisse: Es werden zwei verschiedene TranskriptionsdatensĂ€tze analysiert: ein Maus-Infektionsdatensatz und ein humaner Asthmadatensatz. FĂŒr die Analyse des Infektionsdatensatzes werden verschiedene lineare Regressionsmodelle miteinander verglichen. Durch eine rĂŒckwĂ€rts-gewandte Modellselektionsstrategie wird gezeigt, dass durch die Infektionskovariaten erster Ordnung zusĂ€tzliche erklĂ€rende Kraft gewonnen wird. Durch das Eruptionsdiagramm werden Effekte zweiter Ordnung aufgedeckt. Ein Modellvergleich identifiziert die Kovariaten dritter Ordnung als Störfaktoren. Das Modell zweiter Ordnung, welches am besten zu den Daten passt, wird fĂŒr die weiterfĂŒhrende Analyse verwendet. Die Ergebnisse der Interaktionskovariate werden in aggravating und alleviating Effekte unterteilt. Ein Interaktionseffekt ist alleviating (aggravating, neutral), falls der Effekt der kombinierten Kovariaten schwĂ€cher (stĂ€rker, identisch) als die Summe der individuellen Effekte dieser Kovariaten ist. Bei der bottom-up Analyse des Asthmadatensatzes werden die Daten nicht auf Einzelgenebene sondern auf Gengruppenebene analysiert. ZunĂ€chst wird das passende Regressionsmodell mit Hilfe des Eruptionsdiagramms aufgestellt. Der Einfluss der einzelnen Gene auf das globale Testergebnis der Gengruppen wird in diagnostischen Balkendiagrammen genauer untersucht. Eine Signalweganalyse der Gengruppen zeigt neue Biomarker und Signalwege fĂŒr die Charakterisierung von allergischem und nicht-allergischem Asthma auf. Diskussion: Die Ergebnisse der Transkriptionsanalyse werden durch Anreicherungsanalysen auf ihre funktionelle Relevanz hin untersucht. Die Ergebnisse zeigten unterschiedliche funktionelle Eigenschaften der aggravating und alleviating Gene auf. Die Anreicherungsanalyse des Asthmadatensatzes der Gene, die von Störfaktoren beeinflusst werden und durch Effektmodifikation gekennzeichnet sind, weisen jedoch keine funktionellen Unterschiede auf.Introduction: Model-based prediction of molecular networks and cellular interactions can be identified by two different strategies of systems biology, top-down and bottom-up strategies. The bottom-up strategy starts at a priori knowledge about single elements and merges into more complex units like signalling pathways or whole systems. Top-down strategies explore datasets of a system and try to identify networks, interactions or components responsible for the system behaviour (i.e. phenotype). In this thesis both strategies are applied to different transcription datasets and the corresponding results are visualized. The strategies can be based on linear regression models. In this work higher order regression models are compared using a new visual tool, the eruption plot. Methods: Eruption plots are generated by overlapping two volcano plots. Both volcano plots are based on the same data, but originate from two different models. Each gene is symbolized by an arrow, which connects the point from the volcano plot of the first model to the point from the volcano plot of the second model. The eruption plot is a visual supporting tool in model selection revealing (ir)relevant covariates, confounding factors and effect modification. Results: Two different transcription datasets are analysed in this work, a mouse-infection dataset and a human asthma dataset. For the analysis of the infection dataset two different linear regression models are being compared. As part of a backward driven model selection strategy the infection covariates provide additional explanatory power. The eruption plot highlights second order effects. A model comparison reveals third order covariates as confounding factors. The second order model that matches the data best is applied in the subsequent analysis. The results of the interaction covariates are divided into aggravating and alleviating effects. An interaction effect is alleviating (aggravating, neutral) if the effect of both covariates is lower (higher, identical) than the sum of both individual effects of these covariates. Within the bottom-up analysis of the asthma dataset the genes are not analysed on the single gene level but on the level of gene groups. By application of an eruption plot the adequate regression model is selected. Diagnostic bar plots help to further investigate the influence of the single gene on the global test result of the gene group. A pathway analysis of the gene groups shows new biomarkers and signalling pathways to characterize allergic and non-allergic asthma. Discussion: The functional relevance of both types of analysis is explored in detail through enrichment analysis. The results of the aggravating and alleviating genes show distinct functional properties. Genes of the asthma dataset are divided into genes influenced by confounding factors and effect modification. The enrichment analysis of these two groups, however, reveals no functional differences
    corecore