6 research outputs found

    Reconstruction de réseaux de gènes à partir de données d'expression par déconvolution centrée autour des hubs

    No full text
    Gene regulatory networks (GRNs) are graphs in which nodes are genes and edges represent causal relationships from regulator genes, towards their downstream targets. One important topological property of GRNs is that a small number of their nodes have a large number of connections whereas the majority of the genes have few connections. The highly connected nodes are called hubs ; they allow any two nodes to be connected by relatively short paths in sparse networks. HubNeD (Hub-centered network deconvolution) is a novel method that exploits topological properties of GRNs to reconstruct them from steady state expression profiles. It works in three steps : firstly, a clustering step extracts genes that are considered solely regulated by grouping them in highly homogeneous co-regulation communities. Secondly, hub are inferred from the remaining genes, by analyzing the similarities of their correlation profiles to the genes in the co-regulations communities. Thirdly, an adjacency matrix is computed by a hub-centered deconvolution of the Pearson correlation scores. This last step penalizes direct connections between non-hubs, thus reducing the rate of false positives. The original strategy of preceding GRN reconstruction by a hub selection step, allows HubNeD to habe the highest performances on expression datasets associated with the two well established experimentally curated GRNs of E. Coli and Saccharomyces cerevisiae.Les réseaux de régulation de gènes (RRG) sont des graphes dans lesquels les nœuds sont des gènes et les arcs représentent les relations de régulation entre gènes régulateurs et gènes cibles. La topologie d’un RRG est caractérisée par un petit nombre de gènes qui ont un grand nombre de connexions alors que la majorité des autres gènes a peu de connexions. Les nœuds hautement connectés s’appellent des hubs ; ils permettent à deux nœuds quelconques d’être connectés par des chemins relativement courts dans les réseaux peu denses que sont les RRGs. HubNeD (Hub-centered network deconvolution) est une nouvelle méthode qui exploite les propriétés topologiques des RRGs pour les reconstruire à partir des profils d’expression des gènes à l’état d’équilibre. La méthode HubNeD se compose de trois étapes : premièrement, une étape de regroupement des gènes considérés comme uniquement régulés en les regroupant dans des communautés de co-régulation hautement homogènes. Deuxièmement, les hubs du RRG sont sélectionnés à partir des gènes restants en analysant les similitudes de leurs profils de corrélation avec les gènes des communautés de co-régulation. Troisièmement, une matrice d’adjacence est calculée par une déconvolution centrée sur les hubs des scores de corrélation de Pearson. Cette dernière étape pénalise les connexions directes entre deux gènes qui n’ont pas été choisis comme hubs, réduisant ainsi le taux de faux positifs. La stratégie originale consistant à reconstituer le RRG après une étape de sélection des hubs permet à HubNeD d’obtenir les meilleures performances sur les jeux de données d’expression associés aux deux RRGs bien établis de E. Coli et Saccharomyces cerevisiae

    Reconstruction de réseaux de gènes à partir de données d'expression par déconvolution centrée autour des hubs

    No full text
    Gene regulatory networks (GRNs) are graphs in which nodes are genes and edges represent causal relationships from regulator genes, towards their downstream targets. One important topological property of GRNs is that a small number of their nodes have a large number of connections whereas the majority of the genes have few connections. The highly connected nodes are called hubs ; they allow any two nodes to be connected by relatively short paths in sparse networks. HubNeD (Hub-centered network deconvolution) is a novel method that exploits topological properties of GRNs to reconstruct them from steady state expression profiles. It works in three steps : firstly, a clustering step extracts genes that are considered solely regulated by grouping them in highly homogeneous co-regulation communities. Secondly, hub are inferred from the remaining genes, by analyzing the similarities of their correlation profiles to the genes in the co-regulations communities. Thirdly, an adjacency matrix is computed by a hub-centered deconvolution of the Pearson correlation scores. This last step penalizes direct connections between non-hubs, thus reducing the rate of false positives. The original strategy of preceding GRN reconstruction by a hub selection step, allows HubNeD to habe the highest performances on expression datasets associated with the two well established experimentally curated GRNs of E. Coli and Saccharomyces cerevisiae.Les réseaux de régulation de gènes (RRG) sont des graphes dans lesquels les nœuds sont des gènes et les arcs représentent les relations de régulation entre gènes régulateurs et gènes cibles. La topologie d’un RRG est caractérisée par un petit nombre de gènes qui ont un grand nombre de connexions alors que la majorité des autres gènes a peu de connexions. Les nœuds hautement connectés s’appellent des hubs ; ils permettent à deux nœuds quelconques d’être connectés par des chemins relativement courts dans les réseaux peu denses que sont les RRGs. HubNeD (Hub-centered network deconvolution) est une nouvelle méthode qui exploite les propriétés topologiques des RRGs pour les reconstruire à partir des profils d’expression des gènes à l’état d’équilibre. La méthode HubNeD se compose de trois étapes : premièrement, une étape de regroupement des gènes considérés comme uniquement régulés en les regroupant dans des communautés de co-régulation hautement homogènes. Deuxièmement, les hubs du RRG sont sélectionnés à partir des gènes restants en analysant les similitudes de leurs profils de corrélation avec les gènes des communautés de co-régulation. Troisièmement, une matrice d’adjacence est calculée par une déconvolution centrée sur les hubs des scores de corrélation de Pearson. Cette dernière étape pénalise les connexions directes entre deux gènes qui n’ont pas été choisis comme hubs, réduisant ainsi le taux de faux positifs. La stratégie originale consistant à reconstituer le RRG après une étape de sélection des hubs permet à HubNeD d’obtenir les meilleures performances sur les jeux de données d’expression associés aux deux RRGs bien établis de E. Coli et Saccharomyces cerevisiae

    Gene regulatory network reconstruction from expression data by hub-centered deconvolution

    No full text
    Les réseaux de régulation de gènes (RRG) sont des graphes dans lesquels les nœuds sont des gènes et les arcs représentent les relations de régulation entre gènes régulateurs et gènes cibles. La topologie d’un RRG est caractérisée par un petit nombre de gènes qui ont un grand nombre de connexions alors que la majorité des autres gènes a peu de connexions. Les nœuds hautement connectés s’appellent des hubs ; ils permettent à deux nœuds quelconques d’être connectés par des chemins relativement courts dans les réseaux peu denses que sont les RRGs. HubNeD (Hub-centered network deconvolution) est une nouvelle méthode qui exploite les propriétés topologiques des RRGs pour les reconstruire à partir des profils d’expression des gènes à l’état d’équilibre. La méthode HubNeD se compose de trois étapes : premièrement, une étape de regroupement des gènes considérés comme uniquement régulés en les regroupant dans des communautés de co-régulation hautement homogènes. Deuxièmement, les hubs du RRG sont sélectionnés à partir des gènes restants en analysant les similitudes de leurs profils de corrélation avec les gènes des communautés de co-régulation. Troisièmement, une matrice d’adjacence est calculée par une déconvolution centrée sur les hubs des scores de corrélation de Pearson. Cette dernière étape pénalise les connexions directes entre deux gènes qui n’ont pas été choisis comme hubs, réduisant ainsi le taux de faux positifs. La stratégie originale consistant à reconstituer le RRG après une étape de sélection des hubs permet à HubNeD d’obtenir les meilleures performances sur les jeux de données d’expression associés aux deux RRGs bien établis de E. Coli et Saccharomyces cerevisiae.Gene regulatory networks (GRNs) are graphs in which nodes are genes and edges represent causal relationships from regulator genes, towards their downstream targets. One important topological property of GRNs is that a small number of their nodes have a large number of connections whereas the majority of the genes have few connections. The highly connected nodes are called hubs ; they allow any two nodes to be connected by relatively short paths in sparse networks. HubNeD (Hub-centered network deconvolution) is a novel method that exploits topological properties of GRNs to reconstruct them from steady state expression profiles. It works in three steps : firstly, a clustering step extracts genes that are considered solely regulated by grouping them in highly homogeneous co-regulation communities. Secondly, hub are inferred from the remaining genes, by analyzing the similarities of their correlation profiles to the genes in the co-regulations communities. Thirdly, an adjacency matrix is computed by a hub-centered deconvolution of the Pearson correlation scores. This last step penalizes direct connections between non-hubs, thus reducing the rate of false positives. The original strategy of preceding GRN reconstruction by a hub selection step, allows HubNeD to habe the highest performances on expression datasets associated with the two well established experimentally curated GRNs of E. Coli and Saccharomyces cerevisiae

    Transcripts’ Evolutionary History and Structural Dynamics Give Mechanistic Insights into the Functional Diversity of the JNK Family

    No full text
    International audienceAlternative splicing and alternative initiation/termination transcription sites have the potential to greatly expand the proteome in eukaryotes by producing several transcript isoforms from the same gene. Although these mechanisms are well described at the genomic level, little is known about their contribution to protein evolution and their impact at the protein structure level. Here, we address both issues by reconstructing the evolutionary history of transcripts and by modeling the tertiary structures of the corresponding protein isoforms. We reconstruct phylogenetic forests relating 60 protein-coding transcripts from the c-Jun N-terminal kinase (JNK) family observed in seven species. We identify two alternative splicing events of ancient origin and show that they induce subtle changes in the protein’s structural dynamics. We highlight a previously uncharacterized transcript whose predicted structure seems stable in solution. We further demonstrate that orphan transcripts, for which no phylogeny could be reconstructed, display peculiar sequence and structural properties. Our approach is implemented in PhyloSofS (Phylogenies of Splicing Isoforms Structures), a fully automated computational tool freely available at https://github.com/PhyloSofS-Team/PhyloSofS

    A global metagenomic map of urban microbiomes and antimicrobial resistance

    No full text
    We present a global atlas of 4,728 metagenomic samples from mass-transit systems in 60 cities over 3 years, representing the first systematic, worldwide catalog of the urban microbial ecosystem. This atlas provides an annotated, geospatial profile of microbial strains, functional characteristics, antimicrobial resistance (AMR) markers, and genetic elements, including 10,928 viruses, 1,302 bacteria, 2 archaea, and 838,532 CRISPR arrays not found in reference databases. We identified 4,246 known species of urban microorganisms and a consistent set of 31 species found in 97% of samples that were distinct from human commensal organisms. Profiles of AMR genes varied widely in type and density across cities. Cities showed distinct microbial taxonomic signatures that were driven by climate and geographic differences. These results constitute a high-resolution global metagenomic atlas that enables discovery of organisms and genes, highlights potential public health and forensic applications, and provides a culture-independent view of AMR burden in cities.Funding: the Tri-I Program in Computational Biology and Medicine (CBM) funded by NIH grant 1T32GM083937; GitHub; Philip Blood and the Extreme Science and Engineering Discovery Environment (XSEDE), supported by NSF grant number ACI-1548562 and NSF award number ACI-1445606; NASA (NNX14AH50G, NNX17AB26G), the NIH (R01AI151059, R25EB020393, R21AI129851, R35GM138152, U01DA053941); STARR Foundation (I13- 0052); LLS (MCL7001-18, LLS 9238-16, LLS-MCL7001-18); the NSF (1840275); the Bill and Melinda Gates Foundation (OPP1151054); the Alfred P. Sloan Foundation (G-2015-13964); Swiss National Science Foundation grant number 407540_167331; NIH award number UL1TR000457; the US Department of Energy Joint Genome Institute under contract number DE-AC02-05CH11231; the National Energy Research Scientific Computing Center, supported by the Office of Science of the US Department of Energy; Stockholm Health Authority grant SLL 20160933; the Institut Pasteur Korea; an NRF Korea grant (NRF-2014K1A4A7A01074645, 2017M3A9G6068246); the CONICYT Fondecyt Iniciación grants 11140666 and 11160905; Keio University Funds for Individual Research; funds from the Yamagata prefectural government and the city of Tsuruoka; JSPS KAKENHI grant number 20K10436; the bilateral AT-UA collaboration fund (WTZ:UA 02/2019; Ministry of Education and Science of Ukraine, UA:M/84-2019, M/126-2020); Kyiv Academic Univeristy; Ministry of Education and Science of Ukraine project numbers 0118U100290 and 0120U101734; Centro de Excelencia Severo Ochoa 2013–2017; the CERCA Programme / Generalitat de Catalunya; the CRG-Novartis-Africa mobility program 2016; research funds from National Cheng Kung University and the Ministry of Science and Technology; Taiwan (MOST grant number 106-2321-B-006-016); we thank all the volunteers who made sampling NYC possible, Minciencias (project no. 639677758300), CNPq (EDN - 309973/2015-5), the Open Research Fund of Key Laboratory of Advanced Theory and Application in Statistics and Data Science – MOE, ECNU, the Research Grants Council of Hong Kong through project 11215017, National Key RD Project of China (2018YFE0201603), and Shanghai Municipal Science and Technology Major Project (2017SHZDZX01) (L.S.
    corecore