5 research outputs found

    snoDB: An interconnected online database of human snoRNA

    Get PDF
    L’ARN est bien plus qu’une molécule transitoire entre l’ADN et les protéines. Au-delà des ARN encodant des protéines, on trouve un vaste éventail d’ARN non-codants qui demeurent encore sous-étudiés. Ces ARN ont été découverts dans les années 1960, mais ce n’est qu’au tournant du siècle que leur incroyable prévalence en cellule a pu être confirmée avec la venue de méthodes de séquençage d’ARN à haut débit. Les expériences à haut débit ont également augmenté de façon exponentielle la quantité de données sur l’ARN créant un besoin pour des outils bio-informatiques permettant leur analyse et leur stockage. Un des premiers, et des plus abondant, type d’ARN non-codant à être découvert sont les petit ARN nucléolaires (snoRNA). Canoniquement caractérisés comme guides de modifications spécifiques dans l’ARN ribosomal, ces petits ARN hautement conservés ont maintenant une liste variée de fonctions non-canoniques, notamment au niveau de l’expression génique, ainsi qu’un nombre croissant d’associations à une panoplie de maladies et de cancer. Considérant la littérature grandissante sur les snoRNA chez l’humain, ainsi que leur connexion maintenant apparente à plusieurs domaines de recherche variés, un regroupement accessible de ce large spectre d’information est maintenant indispensable. Malheureusement, les bases de données en ligne de snoRNA humain, snoRNABase, snOPY, et snoRNA Atlas, ne sont plus à jour ou sont trop pointues au niveau de leurs données. De plus, elles figurent peu ou pas de données d’interactions non-canonique et/ou d’expression. Nous avons donc créé snoDB : une base de données interactive de snoRNA humain qui contient des données sur leurs fonctions non-canoniques, trouvées à travers la littérature, des données d’expression dans une panoplie de tissus, et bien plus. Contrairement à ces prédécesseurs, snoDB offre une visualisions sélectives de son plus large éventail de données, au sein d’une table interactive aux options de recherche abondantes. Les données d’expression peuvent également être visualisées dans la même page, sous forme de carte de chaleur, grâce à l’application sœur de snoDB : snoTHAW. snoDB se démarque aussi par sa connectivité à plus d’une douzaine de ressources incluant le consortium RNAcentral, la plus grande base de données d’ARN non-codant, dont snoDB fais maintenant parti. Les données de ces ressources ont été acquises puis jointe ensemble dans une base de données relationnel postgreSQL. De plus, elles sont toutes en lien dans la table de snoDB afin de facilement pouvoir corroborer l’information visible, ainsi qu’accéder aux fonctionnalités des autres sites. Enfin, snoDB a été construit pour être facile à mettre à jour afin d’assurer ces contributions à la recherche pour de nombreuses années.Abstract: RNA is more than just a transitory molecule between DNA and proteins. Beyond the scope of protein-coding RNAs lies a vast underexplored landscape of non-coding RNAs (ncRNA). These RNAs have been slowly uncovered since the 1960s but it took until the turn of the century, and the advent of high-throughput RNA-Sequencing methodologies, for us to finally see how dominated by ncRNAs the transcriptome really is. High-throughput experiments also exponentially expanded the amount of data on RNA and created a need for bioinformatics tools for their analysis and storage. One of the first, and most abundant, ncRNA types to be discovered was small nucleolar RNAs (snoRNAs). Canonically pegged as guides for the modification of pre-ribosomal RNAs, these highly conserved RNAs now boast a diverse list of crucial non-canonical roles, notably in gene expression, as well as being associated to a myriad of diseases and cancers. Considering the growing body of literature surrounding snoRNAs in humans, and their increasing connections to a broad range of fields of study, having an accessible and comprehensive assessment of these data has become essential. Unfortunately, existing online human snoRNA databases, snoRNABase, snOPY, and snoRNA Atlas, are either outdated or too narrow in scope, focusing almost exclusively on canonical snoRNA interactions and lacking expression data. As such, we have created snoDB: a modern, interactive database of human snoRNAs with curated data on non-canonical snoRNA interactions, expression data in a growing range of tissues and cell lines, and more. Unlike the old snoRNA databases, snoDB features extensive visualisation and filtering capabilities, allowing for its larger array of data to be selectively viewed in an interactive and customizable table. Expression data can be further visualised in interactive heatmaps thanks to snoDB’s sister tool: snoTHAW. snoDB also innovates by being much more interconnected with other resources. Data was gathered, and joined together in a relational postgreSQL database, from over a dozen resources, including the RNAcentral database consortium, the largest database of ncRNA sequences, of which snoDB is now a part of. In addition, all resources are linked to in-table, where data they provided appears, to help corroborate the data shown for transparency, as well as to grant access to interesting features housed on remote sites. Finally, snoDB is built to be easily maintainable, updatable and extensible to keep up with ongoing developments and insure that the information it contains will contribute to snoRNA research for years to come

    RNAcentral 2021: secondary structure integration, improved sequence search and new member databases

    Get PDF
    RNAcentral is a comprehensive database of non-coding RNA (ncRNA) sequences that provides a single access point to 44 RNA resources and >18 million ncRNA sequences from a wide range of organisms and RNA types. RNAcentral now also includes secondary (2D) structure information for >13 million sequences, making RNAcentral the world's largest RNA 2D structure database. The 2D diagrams are displayed using R2DT, a new 2D structure visualization method that uses consistent, reproducible and recognizable layouts for related RNAs. The sequence similarity search has been updated with a faster interface featuring facets for filtering search results by RNA type, organism, source database or any keyword. This sequence search tool is available as a reusable web component, and has been integrated into several RNAcentral member databases, including Rfam, miRBase and snoDB. To allow for a more fine-grained assignment of RNA types and subtypes, all RNAcentral sequences have been annotated with Sequence Ontology terms. The RNAcentral database continues to grow and provide a central data resource for the RNA community

    RNAcentral 2021: secondary structure integration, improved sequence search and new member databases.

    Get PDF
    RNAcentral is a comprehensive database of non-coding RNA (ncRNA) sequences that provides a single access point to 44 RNA resources and >18 million ncRNA sequences from a wide range of organisms and RNA types. RNAcentral now also includes secondary (2D) structure information for >13 million sequences, making RNAcentral the world's largest RNA 2D structure database. The 2D diagrams are displayed using R2DT, a new 2D structure visualization method that uses consistent, reproducible and recognizable layouts for related RNAs. The sequence similarity search has been updated with a faster interface featuring facets for filtering search results by RNA type, organism, source database or any keyword. This sequence search tool is available as a reusable web component, and has been integrated into several RNAcentral member databases, including Rfam, miRBase and snoDB. To allow for a more fine-grained assignment of RNA types and subtypes, all RNAcentral sequences have been annotated with Sequence Ontology terms. The RNAcentral database continues to grow and provide a central data resource for the RNA community. RNAcentral is freely available at https://rnacentral.org

    snoDB: An interconnected online database of human snoRNA

    No full text
    L’ARN est bien plus qu’une molécule transitoire entre l’ADN et les protéines. Au-delà des ARN encodant des protéines, on trouve un vaste éventail d’ARN non-codants qui demeurent encore sous-étudiés. Ces ARN ont été découverts dans les années 1960, mais ce n’est qu’au tournant du siècle que leur incroyable prévalence en cellule a pu être confirmée avec la venue de méthodes de séquençage d’ARN à haut débit. Les expériences à haut débit ont également augmenté de façon exponentielle la quantité de données sur l’ARN créant un besoin pour des outils bio-informatiques permettant leur analyse et leur stockage. Un des premiers, et des plus abondant, type d’ARN non-codant à être découvert sont les petit ARN nucléolaires (snoRNA). Canoniquement caractérisés comme guides de modifications spécifiques dans l’ARN ribosomal, ces petits ARN hautement conservés ont maintenant une liste variée de fonctions non-canoniques, notamment au niveau de l’expression génique, ainsi qu’un nombre croissant d’associations à une panoplie de maladies et de cancer. Considérant la littérature grandissante sur les snoRNA chez l’humain, ainsi que leur connexion maintenant apparente à plusieurs domaines de recherche variés, un regroupement accessible de ce large spectre d’information est maintenant indispensable. Malheureusement, les bases de données en ligne de snoRNA humain, snoRNABase, snOPY, et snoRNA Atlas, ne sont plus à jour ou sont trop pointues au niveau de leurs données. De plus, elles figurent peu ou pas de données d’interactions non-canonique et/ou d’expression. Nous avons donc créé snoDB : une base de données interactive de snoRNA humain qui contient des données sur leurs fonctions non-canoniques, trouvées à travers la littérature, des données d’expression dans une panoplie de tissus, et bien plus. Contrairement à ces prédécesseurs, snoDB offre une visualisions sélectives de son plus large éventail de données, au sein d’une table interactive aux options de recherche abondantes. Les données d’expression peuvent également être visualisées dans la même page, sous forme de carte de chaleur, grâce à l’application sœur de snoDB : snoTHAW. snoDB se démarque aussi par sa connectivité à plus d’une douzaine de ressources incluant le consortium RNAcentral, la plus grande base de données d’ARN non-codant, dont snoDB fais maintenant parti. Les données de ces ressources ont été acquises puis jointe ensemble dans une base de données relationnel postgreSQL. De plus, elles sont toutes en lien dans la table de snoDB afin de facilement pouvoir corroborer l’information visible, ainsi qu’accéder aux fonctionnalités des autres sites. Enfin, snoDB a été construit pour être facile à mettre à jour afin d’assurer ces contributions à la recherche pour de nombreuses années.Abstract: RNA is more than just a transitory molecule between DNA and proteins. Beyond the scope of protein-coding RNAs lies a vast underexplored landscape of non-coding RNAs (ncRNA). These RNAs have been slowly uncovered since the 1960s but it took until the turn of the century, and the advent of high-throughput RNA-Sequencing methodologies, for us to finally see how dominated by ncRNAs the transcriptome really is. High-throughput experiments also exponentially expanded the amount of data on RNA and created a need for bioinformatics tools for their analysis and storage. One of the first, and most abundant, ncRNA types to be discovered was small nucleolar RNAs (snoRNAs). Canonically pegged as guides for the modification of pre-ribosomal RNAs, these highly conserved RNAs now boast a diverse list of crucial non-canonical roles, notably in gene expression, as well as being associated to a myriad of diseases and cancers. Considering the growing body of literature surrounding snoRNAs in humans, and their increasing connections to a broad range of fields of study, having an accessible and comprehensive assessment of these data has become essential. Unfortunately, existing online human snoRNA databases, snoRNABase, snOPY, and snoRNA Atlas, are either outdated or too narrow in scope, focusing almost exclusively on canonical snoRNA interactions and lacking expression data. As such, we have created snoDB: a modern, interactive database of human snoRNAs with curated data on non-canonical snoRNA interactions, expression data in a growing range of tissues and cell lines, and more. Unlike the old snoRNA databases, snoDB features extensive visualisation and filtering capabilities, allowing for its larger array of data to be selectively viewed in an interactive and customizable table. Expression data can be further visualised in interactive heatmaps thanks to snoDB’s sister tool: snoTHAW. snoDB also innovates by being much more interconnected with other resources. Data was gathered, and joined together in a relational postgreSQL database, from over a dozen resources, including the RNAcentral database consortium, the largest database of ncRNA sequences, of which snoDB is now a part of. In addition, all resources are linked to in-table, where data they provided appears, to help corroborate the data shown for transparency, as well as to grant access to interesting features housed on remote sites. Finally, snoDB is built to be easily maintainable, updatable and extensible to keep up with ongoing developments and insure that the information it contains will contribute to snoRNA research for years to come
    corecore