28 research outputs found
Modellierung von Reverse Engineering Strategien zur Identifizierung genetischer Netzwerke aus unvollständigen Genexpressionsdate
Genetische Netzwerke zeigen wie Gene über ihre Produkte wieder andere Gene regulieren. Sind die Netzwerktopologie und die Art der Einflüsse bekannt, können Vorhersagen über das dynamische Verhalten der individuellen genetischen Expression von Zellen getroffen werden. Mögliche Modelle für genetische Netzwerke sind Boolesche Netze und Dynamische Bayessche Netze. Genregulationsnetzwerke zu analysieren und zu verstehen, ist auf einer abstrakten Ebene mit Hilfe eines Computers und dieser Modelle möglich. In der vorliegenden Arbeit wird auf der Basis von in-silico Experimenten analysiert, wie ein Modell für genetische Netzwerke aus Genexpressionsdaten von einzelnen Zellen gelernt werden kann, wenn nur unvollständiges Wissen über die initialen Genexpressionszustände vorliegt. Der initiale Expressionszustand wird unvollständig festgelegt, indem die Expressionsstärke einiger Gene gezielt manipuliert wird. Boolesche Netze repräsentieren das genetische Netzwerk der in-silico Zellen. Ihre Regeln sind deterministischer Art und sind bei vollständig gegebenen Daten mit dem Reverse Engineering Algorithmus REVEAL einfach rekonstruierbar. REVEAL hat keinen Ansatz für unbeobachtete Werte in den Daten. Es wird gezeigt, dass die Inputelemente und Booleschen Regeln für Elemente lernbar sind, deren Anzahl an Inputelementen kleiner oder gleich der manipulierbaren Gene ist. Durch Rauschen in den Daten ist es jedoch unmöglich deterministische Beziehungen korrekt zu charakterisieren. Deshalb wird angestrebt, aus den künstlichen Expressionsdaten ein Dynamisch Bayessches Netz zu lernen. Es modelliert die verbleibende Unsicherheit über die Abhängigkeiten in dem genetischen Netzwerk. Eine Analyse des Verfahrens Strukturelle Erwartungswert Maximierung (SEM) ergab, dass die fehlenden Beobachtungen umgangen werden müssen. Eine getrennte Auswertung der Experimente, die sich in den manipulierten Genen unterscheiden, ist ein Weg ein gutes Modell zu lernen, wenn mindestens zwei Gene gleichzeitig manipulierbar sind. Kann die Expressionsstärke nur von einem Gen festgelegt werden, sind mit dieser Strategie die regulierenden Gene identifizierbar, die unabhängig von den anderen regulierenden Genen den Expressionszustand des Zielgens wesentlich bestimmen. Qualitatives Vorwissen über das interessierende genetische Netzwerk kann eine umfangreiche Verringerung des notwendigen Stichprobenumfangs herbeiführen
Non-coding RNAs in Ciona intestinalis
Motivation: The analysis of animal genomes showed that only a minute part of their DNA codes for proteins. Recent experimental results agree, however, that a large fraction of these genomes are transcribed and hence are probably functional at the RNA level. A computational survey of vertebrate genomes has predicted thousands of previously unknown ncRNAs with evolutionarily conserved secondary structures. Extending these comparative studies beyond vertebrates is difficult, however, since most ncRNAs evolve quickly at the sequence level while conserving their characteristic secondarystructures.
Results: We report on a computational screen of structured ncRNAs in the urochordate lineage based on a comparison of the genomic data from Ciona intestinalis , Ciona savignyi and Oikopleura dioica . We predict >1000 ncRNAs with an evolutionarily conserved RNA secondary structure. Of these, about a quarter are located in introns of known protein coding sequences. A few RNA motifs can be identified as known RNAs, including ∼300 tRNAs, some 100 snRNA genes and a few microRNAs and snoRNAs
Prediction of structured non-coding RNAs in the genomes of the nematodes Caenorhabditis elegans and Caenorhabditis briggsae
We present a survey for non‐coding RNAs and other structured RNA motifs in the genomes of Caenorhabditis elegans and Caenorhabditis briggsae using the RNAz program. This approach explicitly evaluates comparative sequence information to detect stabilizing selection acting on RNA secondary structure.
We detect 3,672 structured RNA motifs, of which only 678 are known non‐translated RNAs (ncRNAs) or clear homologs of known C. elegans ncRNAs. Most of these signals are located in introns or at a distance from known protein‐coding genes. With an estimated false positive rate of about 50% and a sensitivity on the order of 50%, we estimate that the nematode genomes contain between 3,000 and 4,000 RNAs with evolutionary conserved secondary structures. Only a small fraction of these belongs to the known RNA classes, including tRNAs, snoRNAs, snRNAs, or microRNAs. A relatively small class of ncRNA candidates is associated with previously observed RNA‐specific upstream elements
The expansion of the metazoan microRNA repertoire
BACKGROUND: MicroRNAs have been identified as crucial regulators in both animals and plants. Here we report on a comprehensive comparative study of all known miRNA families in animals. We expand the MicroRNA Registry 6.0 by more than 1000 new homologs of miRNA precursors whose expression has been verified in at least one species. Using this uniform data basis we analyze their evolutionary history in terms of individual gene phylogenies and in terms of preservation of genomic nearness across species. This allows us to reliably identify microRNA clusters that are derived from a common transcript. RESULTS: We identify three episodes of microRNA innovation that correspond to major developmental innovations: A class of about 20 miRNAs is common to protostomes and deuterostomes and might be related to the advent of bilaterians. A second large wave of innovations maps to the branch leading to the vertebrates. The third significant outburst of miRNA innovation coincides with placental (eutherian) mammals. In addition, we observe the expected expansion of the microRNA inventory due to genome duplications in early vertebrates and in an ancestral teleost. The non-local duplications in the vertebrate ancestor are predated by local (tandem) duplications leading to the formation of about a dozen ancient microRNA clusters. CONCLUSION: Our results suggest that microRNA innovation is an ongoing process. Major expansions of the metazoan miRNA repertoire coincide with the advent of bilaterians, vertebrates, and (placental) mammals
The expansion of the metazoan microRNA repertoire
Background:
MicroRNAs have been identified as crucial regulators in both animals and plants.Here we report on a comprehensive comparative study of all known miRNA families in animals.We expand the MicroRNA Registry 6.0 by more than 1000 new homologs of miRNA precursorswhose expression has been verified in at least one species. Using this uniform data basis we analyzetheir evolutionary history in terms of individual gene phylogenies and in terms of preservation ofgenomic nearness across species. This allows us to reliably identify microRNA clusters that arederived from a common transcript.
Results:
We identify three episodes of microRNA innovation that correspond to majordevelopmental innovations: A class of about 20 miRNAs is common to protostomes anddeuterostomes and might be related to the advent of bilaterians. A second large wave ofinnovations maps to the branch leading to the vertebrates. The third significant outburst of miRNAinnovation coincides with placental (eutherian) mammals. In addition, we observe the expectedexpansion of the microRNA inventory due to genome duplications in early vertebrates and in anancestral teleost. The non-local duplications in the vertebrate ancestor are predated by local(tandem) duplications leading to the formation of about a dozen ancient microRNA clusters.
Conclusion:
Our results suggest that microRNA innovation is an ongoing process. Majorexpansions of the metazoan miRNA repertoire coincide with the advent of bilaterians, vertebrates,and (placental) mammals
RNAstrand: reading direction of structured RNAs in multiple sequence alignments
<p>Abstract</p> <p>Motivation</p> <p>Genome-wide screens for structured ncRNA genes in mammals, urochordates, and nematodes have predicted thousands of putative ncRNA genes and other structured RNA motifs. A prerequisite for their functional annotation is to determine the reading direction with high precision.</p> <p>Results</p> <p>While folding energies of an RNA and its reverse complement are similar, the differences are sufficient at least in conjunction with substitution patterns to discriminate between structured RNAs and their complements. We present here a support vector machine that reliably classifies the reading direction of a structured RNA from a multiple sequence alignment and provides a considerable improvement in classification accuracy over previous approaches.</p> <p>Software</p> <p>RNAstrand is freely available as a stand-alone tool from <url>http://www.bioinf.uni-leipzig.de/Software/RNAstrand</url> and is also included in the latest release of RNAz, a part of the Vienna RNA Package.</p
Evolutionary patterns of non-coding RNAs
A plethora of new functions of non-coding RNAs have been discovered in past few years. In fact, RNA is emerging as the central player in cellular regulation, taking on active roles in multiple regulatory layers from transcription, RNA maturation, and RNA modification to translational regulation. Nevertheless, very little is known about the evolution of this \Modern RNA World' and its components. In this contribution we attempt to provide at least a cursory overview of the diversity of non-coding RNAs and functional RNA motifs in non-translated regions of regular messenger RNAs (mRNAs) with an emphasis on evolutionary questions. This survey is complemented by an in-depth analysis of examples from different classes of RNAs focusing mostly on their evolution in the vertebrate lineage. We present a survey of
Y RNA genes in vertebrates, studies of the molecular evolution of the U7 snRNA, the snoRNAs E1/U17, E2, and E3, the Y RNA family, the let-7 microRNA family, and the mRNA-like evf-1 gene. We furthermore discuss the statistical distribution of microRNAs in metazoans, which suggests an explosive increase in the microRNA repertoire in vertebrates. The analysis of the transcription of non-coding RNAs (ncRNAs) suggests that small RNAs in general are genetically mobile in the sense that their association with a hostgene (e.g. when transcribed from introns of a mRNA) can change on evolutionary time scales. The let-7 family demonstrates, that even the mode of transcription (as intron or as exon) can change among paralogous ncRNA
Modellierung von Reverse Engineering Strategien zur Identifizierung genetischer Netzwerke aus unvollständigen Genexpressionsdate
Genetische Netzwerke zeigen wie Gene über ihre Produkte wieder andere Gene regulieren. Sind die Netzwerktopologie und die Art der Einflüsse bekannt, können Vorhersagen über das dynamische Verhalten der individuellen genetischen Expression von Zellen getroffen werden. Mögliche Modelle für genetische Netzwerke sind Boolesche Netze und Dynamische Bayessche Netze. Genregulationsnetzwerke zu analysieren und zu verstehen, ist auf einer abstrakten Ebene mit Hilfe eines Computers und dieser Modelle möglich. In der vorliegenden Arbeit wird auf der Basis von in-silico Experimenten analysiert, wie ein Modell für genetische Netzwerke aus Genexpressionsdaten von einzelnen Zellen gelernt werden kann, wenn nur unvollständiges Wissen über die initialen Genexpressionszustände vorliegt. Der initiale Expressionszustand wird unvollständig festgelegt, indem die Expressionsstärke einiger Gene gezielt manipuliert wird. Boolesche Netze repräsentieren das genetische Netzwerk der in-silico Zellen. Ihre Regeln sind deterministischer Art und sind bei vollständig gegebenen Daten mit dem Reverse Engineering Algorithmus REVEAL einfach rekonstruierbar. REVEAL hat keinen Ansatz für unbeobachtete Werte in den Daten. Es wird gezeigt, dass die Inputelemente und Booleschen Regeln für Elemente lernbar sind, deren Anzahl an Inputelementen kleiner oder gleich der manipulierbaren Gene ist. Durch Rauschen in den Daten ist es jedoch unmöglich deterministische Beziehungen korrekt zu charakterisieren. Deshalb wird angestrebt, aus den künstlichen Expressionsdaten ein Dynamisch Bayessches Netz zu lernen. Es modelliert die verbleibende Unsicherheit über die Abhängigkeiten in dem genetischen Netzwerk. Eine Analyse des Verfahrens Strukturelle Erwartungswert Maximierung (SEM) ergab, dass die fehlenden Beobachtungen umgangen werden müssen. Eine getrennte Auswertung der Experimente, die sich in den manipulierten Genen unterscheiden, ist ein Weg ein gutes Modell zu lernen, wenn mindestens zwei Gene gleichzeitig manipulierbar sind. Kann die Expressionsstärke nur von einem Gen festgelegt werden, sind mit dieser Strategie die regulierenden Gene identifizierbar, die unabhängig von den anderen regulierenden Genen den Expressionszustand des Zielgens wesentlich bestimmen. Qualitatives Vorwissen über das interessierende genetische Netzwerk kann eine umfangreiche Verringerung des notwendigen Stichprobenumfangs herbeiführen
Modellierung von Reverse Engineering Strategien zur Identifizierung genetischer Netzwerke aus unvollständigen Genexpressionsdate
Genetische Netzwerke zeigen wie Gene über ihre Produkte wieder andere Gene regulieren. Sind die Netzwerktopologie und die Art der Einflüsse bekannt, können Vorhersagen über das dynamische Verhalten der individuellen genetischen Expression von Zellen getroffen werden. Mögliche Modelle für genetische Netzwerke sind Boolesche Netze und Dynamische Bayessche Netze. Genregulationsnetzwerke zu analysieren und zu verstehen, ist auf einer abstrakten Ebene mit Hilfe eines Computers und dieser Modelle möglich. In der vorliegenden Arbeit wird auf der Basis von in-silico Experimenten analysiert, wie ein Modell für genetische Netzwerke aus Genexpressionsdaten von einzelnen Zellen gelernt werden kann, wenn nur unvollständiges Wissen über die initialen Genexpressionszustände vorliegt. Der initiale Expressionszustand wird unvollständig festgelegt, indem die Expressionsstärke einiger Gene gezielt manipuliert wird. Boolesche Netze repräsentieren das genetische Netzwerk der in-silico Zellen. Ihre Regeln sind deterministischer Art und sind bei vollständig gegebenen Daten mit dem Reverse Engineering Algorithmus REVEAL einfach rekonstruierbar. REVEAL hat keinen Ansatz für unbeobachtete Werte in den Daten. Es wird gezeigt, dass die Inputelemente und Booleschen Regeln für Elemente lernbar sind, deren Anzahl an Inputelementen kleiner oder gleich der manipulierbaren Gene ist. Durch Rauschen in den Daten ist es jedoch unmöglich deterministische Beziehungen korrekt zu charakterisieren. Deshalb wird angestrebt, aus den künstlichen Expressionsdaten ein Dynamisch Bayessches Netz zu lernen. Es modelliert die verbleibende Unsicherheit über die Abhängigkeiten in dem genetischen Netzwerk. Eine Analyse des Verfahrens Strukturelle Erwartungswert Maximierung (SEM) ergab, dass die fehlenden Beobachtungen umgangen werden müssen. Eine getrennte Auswertung der Experimente, die sich in den manipulierten Genen unterscheiden, ist ein Weg ein gutes Modell zu lernen, wenn mindestens zwei Gene gleichzeitig manipulierbar sind. Kann die Expressionsstärke nur von einem Gen festgelegt werden, sind mit dieser Strategie die regulierenden Gene identifizierbar, die unabhängig von den anderen regulierenden Genen den Expressionszustand des Zielgens wesentlich bestimmen. Qualitatives Vorwissen über das interessierende genetische Netzwerk kann eine umfangreiche Verringerung des notwendigen Stichprobenumfangs herbeiführen
RNAstrand
Motivation: Genome-wide screens for structured ncRNA genes in mammals, urochordates, and nematodes have predicted thousands of putative ncRNA genes and other structured RNA motifs. A prerequisite for their functional annotation is to determine the reading direction with high precision.
Results: While folding energies of an RNA and its reverse complement
are similar, the difference are sufficient at least in conjunction
with substitution patterns to discriminate between structured RNAs
and their complements. We present here a support vector machine
(SVM) that reliably classifies the reading direction of a structured RNA
from a multiple sequence alignment.
Software: RNAstrand is freely available as a stand-alone tool from
http://www.bioinf.uni-leipzig.de/Software and included
in the latest release of RNAz, a part of the Vienna RNA Package, from http://www.bioinf.uni-leipzig.de/RNA