20 research outputs found

    Parallel stepwise stochastic simulation: Harnessing GPUs to Explore Possible Futures States of a Chromosome Folding Model Thanks to the Possible Futures Algorithm (PFA)

    Get PDF
    International audienceFor the sake of software compatibility, simulations are often parallelized withoutmuch code rewriting. Performances can be further improved by optimizing codes so that to use themaximum power offered by parallel architectures. While this approach can provide some speed-up,performance of parallelized codes can be strongly limited a priori because traditional algorithmshave been designed for sequential technologies. Thus, additional increase of performance shouldultimately rely on some redesign of algorithms.Here, we redesign an algorithm that has traditionally been used to simulate the folding proper-ties of polymers. We address the issue of performance in the context of biological applications,more particularly in the active field of chromosome modelling. Due to the strong confinementof chromosomes in the cells, simulation of their motion is slowed down by the laborious searchfor the next valid states to progress. Our redesign, that we call the Possible Futures Algorithm(PFA), relies on the parallel computation of possible evolutions of the same state, which effectivelyincreases the probability to obtain a valid state at each step. We apply PFA on a GPU-basedarchitecture, allowing us to optimally reduce the latency induced by the computation overhead ofpossible futures. We show that compared to the initial sequential model the acceptance rate of newstates significantly increases without impacting the execution time. In particular, the stronger theconfinement of the chromosome, the more efficient PFA becomes, making our approach appealingfor biological applications.While most of our results were obtained using Fermi architecture GPUs from NVIDIA, we highlightimproved performance on the cutting-edge Kepler architecture K20 GPUs

    An organelle-specific protein landscape identifies novel diseases and molecular mechanisms

    Get PDF
    Contains fulltext : 158967.pdf (publisher's version ) (Open Access)Cellular organelles provide opportunities to relate biological mechanisms to disease. Here we use affinity proteomics, genetics and cell biology to interrogate cilia: poorly understood organelles, where defects cause genetic diseases. Two hundred and seventeen tagged human ciliary proteins create a final landscape of 1,319 proteins, 4,905 interactions and 52 complexes. Reverse tagging, repetition of purifications and statistical analyses, produce a high-resolution network that reveals organelle-specific interactions and complexes not apparent in larger studies, and links vesicle transport, the cytoskeleton, signalling and ubiquitination to ciliary signalling and proteostasis. We observe sub-complexes in exocyst and intraflagellar transport complexes, which we validate biochemically, and by probing structurally predicted, disruptive, genetic variants from ciliary disease patients. The landscape suggests other genetic diseases could be ciliary including 3M syndrome. We show that 3M genes are involved in ciliogenesis, and that patient fibroblasts lack cilia. Overall, this organelle-specific targeting strategy shows considerable promise for Systems Medicine

    The convergence of structural and functional modularities in complex systems

    No full text
    L objet de cette thèse est la convergence structure-fonction dans les systèmes complexes et ses applications aux systèmes vivants et aux systèmes technico-économiques. Après avoir défini la modularité et identifié les difficultés associées à sa définition, cette thèse formalise le concept de convergence structure-fonction dans les systèmes évolutifs et fonctionnels et montre son intérêt pour l évolutivité et la robustesse de ces systèmes. Ensuite, elle applique ce concept à des problématiques réelles de systèmes évolutifs et fonctionnels en biologie et en économie afin d illustrer son utilité. Ainsi, dans le cadre de la génomique, cette thèse montre que la longueur des opérons bactériens, qui sont à la fois des modules structurels et fonctionnels, est limitée du fait de contraintes dues à l interaction des mécanismes de transcription et de réplication. Ensuite, elle fait l hypothèse que la modularité structurelle des points chauds de recombinaison correspond au moins partiellement à la modularité fonctionnelle des gènes. Ceci permet de développer une nouvelle méthode d analyse des études d association génétique basée sur un découpage en régions géniques du génome dans le but de faciliter la compréhension du mécanisme fonctionnel de leur action sur le caractère étudié en analysant directement l association de gènes ou de groupe de gènes avec ce caractère. Sur le plan structurel, les résultats sont d une qualité comparable à ceux des méthodes classiques. En revanche, le découpage en régions devra encore être affiné afin d obtenir une analyse fonctionnelle pleinement utile. Enfin, dans le cadre de la libéralisation du marché européen de l électricité, la correspondance effective entre structure et fonction de chaque acteur issu de la restructuration fait supposer que le principe de convergence structure-fonction y est bien appliqué. Cependant, des difficultés subsistent avant de parvenir à mettre en place des relations structurelles permettant d atteindre l optimum souhaité. Celui-ci inclut des échanges d énergie à l origine des contraintes couplantes entre les acteurs. A partir de la théorie de la décomposition par les prix, nous proposons un cadre permettant de définir des tarifs propres à les faciliter, en particulier celles liant producteurs et transporteurs. En conclusion, cette thèse montre (a) la limite à la convergence structure-fonction que constitue la limite de la longueur des opérons bactériens, (b) la faisabilité de l utilisation d un découpage basé sur les limites de gènes afin d analyser des études d association génétique à grande échelle et (c) l importance d améliorer la grande boucle des relations entre producteurs et transporteurs d électricité afin d assurer l optimisation conjointe des investissements en capacité de production et de transport. Elle synthétise l ensemble de ces résultats dans le cadre conceptuel de la convergence structure-fonction qui postule que la modularité structurelle des systèmes évolutifs et fonctionnels tend à se superposer à leur modularité fonctionnelle afin de leur apporter robustesse et évolutivité.The aim of this thesis is to investigate the structure-function convergence in complex systems by way of applications to living systems and technical-economical systems. Once having both defined modularity and identified the difficulties coupled to its core definition, this thesis formalizes the structure-function convergence in evolutive and functional systems and illustrates the interest of this concept with regard to the evolvability and robustness of these systems. Furthermore, this concept is applied to open questions in real biological and economic systems. In the field of genomics, this thesis establishes that the length of bacterial operons, which are structural and functional modules at the same time, is limited by the interactions of transcription and replication mechanisms. Then, this thesis make the hypothesis that the modular structure defined by recombination hotspots at least partially corresponds to the functional modularity defined by genes. This enables to develop a new method to analyse genetic association studies. It is based on a partition of the genome into bins with boundaries based on gene boundaries. This method renders easier the understanding of the functional mechanism of their action on the studied character. Indeed, it analyses directly the association of individual or group of genes with this character. On the structural level, results are of a quality comparable to those obtained obtained through standard methods. However, the gene based partition will need to be refined in order to obtain a fully useful functional analysis. Finally, when considering the opening-up of the European electricity market, the correspondence between structure and function of actors issued from the reorganization suggests that the structure-function convergence principle is correctly applied. However, the present structural relationships between actors prevent the system from reaching the desired optimality. This optimality includes energy exchanges which impose coupling constraints on the system. Thanks to the price decomposition theory, we propose a framework to define tariffs useful to improve such relationships, particularly those linking production and transmission operators. As a conclusion, this thesis shows (a) the limit of structure-function convergence implied by the length limit of bacterial operons, (b) the feasibility of a gene based bin analysis of genome-wide genetic association studies, (c) the importance of improving the relationships between production and transmission operators in order to assume a joint optimization of investments in production and transmission capacities. This thesis sums up these results in the conceptual framework of structure-function convergence, which postulates that the modular structure of evolutive and functional systems tend to superimpose their functional modularity in order to give them robustness and evolvability.EVRY-Bib. électronique (912289901) / SudocSudocFranceF

    Prédiction de la localisation cellulaire des protéines à l'aide de leurs séquences biologiques

    No full text
    Les compartiments cellulaires, de par les frontières membranaires qui les définissent, permettent l'accomplissement de taches métaboliques diverses au sein de la cellule. Cette spécialisation en domaines intracellulaires induit donc une différentiation dans la fonction des protéines qui les composent. Le grand nombre de gènes orphelins produits ces dernières années par les projets de séquençages motive la mise au point de méthodes efficaces pour la prédiction ab-initio de la localisation cellulaire des protéines. Ainsi la majorité de ce travail de thèse s'intéresse au problème de la prédiction du compartiment cellullaire d'une protéine à partir de sa séquence primaire. Nous nous sommes attachés à proposer des alternatives descriptives aux méthodes existantes de prédiction de la localisation cellulaire en utilisant : (1) de nouveaux descripteurs issus de la séquence nucléique, (2) une approche par chaînes de Markov cachées (CMC) et arbres de décision. L'approche par CMC est justifiée biologiquement a posteriori car elle permet la modélisation de signaux d'adressage conjointement à la prise en compte de la composition globale. En outre, l'étape de classification hiérarchique par arbre améliore nettement les résultats de classification. Les résultats obtenus lors des comparaisons avec les méthodes existantes et utilisant des descripteurs fondés sur la composition globale possèdent des performances similairesCellular compartments, due to the membrane frontiers they induce, allow the realization of diverse metabolic tasks in the cell. This specialization of the cell's spatial domains directly corresponds to a differentiation in the functional role of the proteins has become an important problem. Thus the major part of the work presented here concerns the pmrediction of the subcellular localization of a protein, knowing its primary or coding sequence. We proposed descriptive alternatives to existing methods for predicting subcellular localization by : (1) using new descriptors from nucleotidic sequence and (2) an HMM approach combined with decision trees. The HMM approach is justified biologically in that it permits to modelize biological adressing signals conjointly with global composition. Furthermore, embedding the classification steps within a decision tree sllightly improved classification results, whose accuracy is similar with other methods using global composition information.EVRY-BU (912282101) / SudocSudocFranceF

    Algorithmes pour la prédiction de structures secondaires d'ARN

    No full text
    La connaissance de la structure secondaire des ARN est importante pour comprendre les relations entre structure et fonction des ARN. Elle est composée d'un ensemble d'hélices constituées de paires de bases complémentaires. Les algorithmes existants ont des complexités d'au moins O(n3). Cette thèse présente un algorithme, appelé P-DCfold, basé sur l'approche comparative pour la prédiction de structures secondaires des ARN avec une complexité en O(n2). Les hélices y sont recherchées récursivement en utilisant l'approche "diviser pour régner". La sélection des hélices est basée sur des critères thermodynamiques et de covariation. Le problème principal de l'approche comparative est la mauvaise qualité des alignements utilisés. P-DCfold utilise donc des modèles d'évolution sous contraintes de structure pour sélectionner les séquences correctement alignées. P-DCfold a prédit la structure secondaire de quelques ARN avec une sensibilité de 0,85 et une sélectivité de 0,95.The knowledge of RNA secondary structure is important to understand the relation between structure and function of the RNA. It is made up of a set of helices resulting from the folding of succession of a complementary base pairs. Complexities of existing algorithms is at least of O(n3). This thesis presents an algorithm, called P-DCFold, based on the comparative approach, for the prediction of RNA secondary structures with a complexity of O(n2). In this algorithm, helices are searched recursively using the "divide and conquer" approach. The selection of helices is based on thermodynamic and covariation criteria. The main problem of the comparative approach is the low quality of used alignment. So, P-DCfold use evolutionary models under structure constraints to select correctly aligned sequences. P-DCFold predicts the secondary structure of several RNA with a sensitivity of 0,85 and a sensibility of 0,95.EVRY-BU (912282101) / SudocSudocFranceF

    Incremental modelling of biological networks

    No full text
    Le domaine scientifique de la Biologie des Systèmes étudie les interactions entre les composantes d'un système biologique afin d'en comprendre son fonctionnement global. Au cours de cette these, nous avons d abord utilisé des graphes simples. Cette approche a permis d' appréhender la manière dont un réseau biologique peut interagir avec son environnement, lui-même modélisé par un autre réseau. Nous avons ensuite défini le formalisme MIB (Model of Interactions in Biology) qui permet de définir, rechercher et étudier les motifs hétérogènes. Enfin pour approfondir l'étude de la structure et de la dynamique, nous avons proposé le formalisme MIN. MIN possède la structure bipartie de MIB, mais permet d'avoir des annotations beaucoup plus riches des noeuds et des arcs du réseau qui peuvent être utilisées pour la traduction des données automatiquement en d'autres formalismes couramment utilisés en modélisation biologique, tels que les équations différentielles ou la modélisation logique.The scientific domain of the Systems Biology studies the interactions between the components of a biological system in order to understand its functioning as a whole. In this thesis, we first used searched to apprehend how a biological network, modelled as a simple graph, interact with its environment, modelled by another graph. Next, we have defined the MIB formalism (for Model of Interactions in Biology) that enables to model, to search and to study the heterogeneous motifs in biological networks. Finally, for deepening the study of structure and dynamics of biological networks, we have proposed the MIN formalism (for Modular Interaction Network). MIN inherited the bipartite structure of MIB, but also includes the richer annotations for nodes, arcs and possible states of the network, thus enabling the automatic translation of data contained in MIN into other formalisms commonly used in biology for dynamics modelling, such as logical networks, differential equations or Petri nets.EVRY-Bib. électronique (912289901) / SudocSudocFranceF

    A polymer model for the quantitative reconstruction of chromosome architecture from HiC and GAM data

    No full text
    International audienceIt is widely believed that the folding of the chromosome in the nucleus has a major effect on genetic expression. For example, coregulated genes in several species have been shown to colocalize in space despite being far away on the DNA sequence. In this manuscript, we present a new, to our knowledge, method to model the three-dimensional structure of the chromosome in live cells based on DNA-DNA interactions measured in high-throughput chromosome conformation capture experiments and genome architecture mapping. Our approach incorporates a polymer model and directly uses the contact probabilities measured in high-throughput chromosome conformation capture experiments and genome architecture mapping experiments rather than estimates of average distances between genomic loci. Specifically, we model the chromosome as a Gaussian polymer with harmonic interactions and extract the coupling coefficients best reproducing the experimental contact probabilities. In contrast to existing methods, we give an exact expression of the contact probabilities at thermodynamic equilibrium. The Gaussian effective model reconstructed with our method reproduces experimental contacts with high accuracy. We also show how Brownian dynamics simulations of our reconstructed Gaussian effective model can be used to study chromatin organization and possibly give some clue about its dynamics
    corecore