222 research outputs found

    Analyse des graphes de reactions biochimiques avec une application au réseau metabolique de la cellule de plante

    Get PDF
    Nowadays, systems biology are facing the challenges of analysing the huge amount of biological data and large-scale metabolic networks. Although several methods have been developed in recent years to solve this problem, it is existing hardness in studying these data and interpreting the obtained results comprehensively. This thesis focuses on analysis of structural properties, computation of elementary flux modes and determination of minimal cut sets of the heterotrophic plant cellmetabolic network. In our research, we have collaborated with biologists to reconstructa mid-size metabolic network of this heterotrophic plant cell. This network contains about 90 nodes and 150 edges. First step, we have done the analysis of structural properties by using graph theory measures, with the aim of finding its owned organisation. The central points orhub reactions found in this step do not explain clearly the network structure. The small-world or scale-free attributes have been investigated, but they do not give more useful information. In the second step, one of the promising analysis methods, named elementary flux modes, givesa large number of solutions, around hundreds of thousands of feasible metabolic pathways that is difficult to handle them manually. In the third step, minimal cut sets computation, a dual approach of elementary flux modes, has been used to enumerate all minimal and unique sets of reactions stopping the feasible pathways found in the previous step. The number of minimal cut sets has a decreasing trend in large-scale networks in the case of growing the network size. We have also combined elementary flux modes analysis and minimal cut sets computation to find the relationship among the two sets of results. The findings reveal the importance of minimal cut sets in use of seeking the hierarchical structure of this network through elementary flux modes. We have set up the circumstance that what will be happened if glucose entry is absent. Bi analysis of small minimal cut sets we have been able to found set of reactions which has to be present to produce the different sugars or metabolites of interest in absence of glucose entry. Minimal cut sets of size 2 have been used to identify 8 reactions which play the role of the skeleton/core of our network. In addition to these first results, by using minimal cut sets of size 3, we have pointed out five reactions as the starting point of creating a new branch in creationof feasible pathways. These 13 reactions create a hierarchical classification of elementary flux modes set. It helps us understanding more clearly the production of metabolites of interest inside the plant cell metabolism.Aujourd’hui, la biologie des systèmes est confrontée aux défis de l’analyse de l’énorme quantité de données biologiques et à la taille des réseaux métaboliques pour des analyses à grande échelle. Bien que plusieurs méthodes aient été développées au cours des dernières années pour résoudre ce problème, ce sujet reste un domaine de recherche en plein essor. Cette thèse se concentre sur l’analyse des propriétés structurales, le calcul des modes élémentaires de flux et la détermination d’ensembles de coupe minimales du graphe formé par ces réseaux. Dans notre recherche, nous avons collaboré avec des biologistes pour reconstruire un réseau métabolique de taille moyenne du métabolisme cellulaire de la plante, environ 90 noeuds et 150 arêtes. En premier lieu, nous avons fait l’analyse des propriétés structurelles du réseau dans le but de trouver son organisation. Les réactions points centraux de ce réseau trouvés dans cette étape n’expliquent pas clairement la structure du réseau. Les mesures classiques de propriétés des graphes ne donnent pas plus d’informations utiles. En deuxième lieu, nous avons calculé les modes élémentaires de flux qui permettent de trouver les chemins uniques et minimaux dans un réseau métabolique, cette méthode donne un grand nombre de solutions, autour des centaines de milliers de voies métaboliques possibles qu’il est difficile de gérer manuellement. Enfin, les coupes minimales de graphe, ont été utilisés pour énumérer tous les ensembles minimaux et uniques des réactions qui stoppent les voies possibles trouvées à la précédente étape. Le nombre de coupes minimales a une tendance à ne pas croître exponentiellement avec la taille du réseau a contrario des modes élémentaires de flux. Nous avons combiné l’analyse de ces modes et les ensembles de coupe pour améliorer l’analyse du réseau. Les résultats montrent l’importance d’ensembles de coupe pour la recherche de la structure hiérarchique du réseau à travers modes de flux élémentaires. Nous avons étudié un cas particulier : qu’arrive-t-il si on stoppe l’entrée de glucose ? En utilisant les coupes minimales de taille deux, huit réactions ont toujours été trouvés dans les modes élémentaires qui permettent la production des différents sucres et métabolites d’intérêt au cas où le glucose est arrêté. Ces huit réactions jouent le rôle du squelette / coeur de notre réseau. En élargissant notre analyse aux coupes minimales de taille 3, nous avons identifié cinq réactions comme point de branchement entre différent modes. Ces 13 réactions créent une classification hiérarchique des modes de flux élémentaires fixés et nous ont permis de réduire considérablement le nombre de cas à étudier (approximativement divisé par 10) dans l’analyse des chemins réalisables dans le réseau métabolique. La combinaison de ces deux outils nous a permis d’approcher plus efficacement l’étude de la production des différents métabolites d’intérêt par la cellule de plante hétérotrophique

    Inférence des réseaux de régulation de la synthèse des protéines de réserve du grain de blé tendre (Triticum aestivum L.) en réponse à l'approvisionnement en azote et en soufre: Inférence des réseaux de régulation de la synthèse des protéines de réserve du grain de blé tendre (Triticum aestivum L.) en réponse à l'approvisionnement en azote et en soufre

    Get PDF
    Grain storage protein content and composition are the main determinants of bread wheat (Triticum aestivum L.) end-use value. Scaling laws governing grain protein composition according to grain nitrogen and sulfur content could be the outcome of a finely tuned regulation network. Although it was demonstrated that the main regulation of grain storage proteins accumulation occurs at the transcriptomic level in cereals, knowledge of the underlying molecular mechanisms is elusive. Moreover, the effects of nitrogen and sulfur on these mechanisms are unknown. The issue of skyrocketing data generation in research projects is addressed by developing high-throughput bioinformatics approaches. Extracting knowledge on from such massive amounts of data is therefore an important challenge. The work presented herein aims at elucidating regulatory networks involved in grain storage protein synthesis and their response to nitrogen and sulfur supply using a rule discovery approach. This approach was extended, implemented in the form of a web-oriented platform dedicated to the inference and analysis of regulatory networks from qualitative and quantitative –omics data. This platform allowed us to define different semantics in a comprehensive framework; each semantic having its own biological meaning, thus providing us with global informative networks. Spatiotemporal specificity of transcription factors expression was observed and particular attention was paid to their relationship with grain storage proteins in the inferred networks. The work initiated here opens up a field of innovative investigation to identify new targets for plant breeding and for an improved end-use value and nutritional quality of wheat in the context of inputs limitation. Further analyses should enhance the understanding of the control of grain protein composition and allow providing wheat adapted to specific uses or deficient in protein fractions responsible for gluten allergenicity and intolerance.La teneur et la composition en protéines de réserve du grain de blé tendre (Triticum aestivum L.) sont les principaux déterminants de sa valeur d’usage et de sa qualité nutritionnelle. La composition en protéines de réserve du grain est déterminée par la teneur en assimilâts azotés et soufrés par grain via des lois d’échelle qui pourraient être les propriétés émergentes de réseaux de régulation. Plusieurs facteurs de transcription intervenant dans cette régulation ont été mis en évidence, mais les voies et mécanismes impliqués sont encore très peu connus. Le constat est identique en ce qui concerne l’impact de la nutrition azotée et soufrée sur ce réseau de régulation. Le développement des outils de génomique fonctionnelle et de bioinformatique permet aujourd’hui d’aborder ces régulations de manière globale via une approche systémique mettant en relation plusieurs niveaux de régulation. L’objectif du travail présenté est d’explorer les réseaux de régulation –omiques impliqués dans le contrôle de l’accumulation des protéines de réserve dans le grain de blé tendre et leur réponse à l’approvisionnement en azote et en soufre. Une approche d’inférence de réseaux basée sur la découverte de règles a été étendue, implémentée sous la forme d’une plateforme web. L’utilisation de cette plateforme a permis de définir des sémantiques multiples afin d’inférer dans un cadre global, des règles possédant différentes significations biologiques. Des facteurs de transcription spécifiques de certains organes et certaines phases de développement ont été mis en évidence et un intérêt particulier a été apporté à leur position dans les réseaux de règles inférés, notamment en relation avec les protéines de réserve. Les travaux initiés dans cette thèse ouvrent un champ d’investigation innovant pour l’identification de nouvelles cibles de sélection variétale pour l’amélioration de la valeur technologique et de la qualité nutritionnelle du blé. Ils devraient ainsi permettre de mieux maîtriser la composition en protéines de réserve et ainsi produire des blés adaptés à des utilisations ciblées ou carencé en certaines fractions protéiques impliquées dans des phénomènes d’allergénicité et d’intolérance du gluten, ce dans un contexte d’agriculture durable et plus économe en intrants

    Étude sur l'endocytose du récepteur de l'insuline : rôle du nœud de signalisation ATIC / PTPLAD1

    Get PDF
    La cellule utilise des nœuds d’interactions protéiques relativement stables, conservés et souvent constitués d’adaptateurs moléculaires pour gérer des signaux reçus (synthèse, sécrétion, traffic, métabolisme, division), des problèmes de sécurité et de niveaux d’énergie. Nos résultats montrent que la cellule utilise aussi des nœuds relativement petits et dynamiques où des informations propres concernant des voies métaboliques apparemment indépendantes sont évaluées. Ces informations y sont intégrées localement et une décision y est prise pour action immédiate. Cette idée est supportée par notre étude sur le récepteur de l’insuline (RI). Ce récepteur transmembranaire à activité tyrosine kinase reconnaît un signal externe (insuline circulante) et engage la signalisation de l’insuline, les réponses métaboliques et le contrôle du glucose circulant. Le RI est aussi impliqué dans l’internalisation de l’insuline et sa dégradation dans les endosomes (clairance). Il régule donc indirectement la sécrétion de l’insuline par les cellules du pancréas endocrine. La signification pathophysiologique de l’endocytose du RI ainsi que les bases moléculaires d’une telle coordination sont peu connues. Nous avons construit un réseau d’interactions du RI (IRGEN) à partir d’un protéome de fractions Golgi-endosomales (G/E) hépatiques. Nous démontrons une forte hétérogénéité fonctionnelle autour du RI avec la présence des protéines ATIC, PTPLAD1, AMPKα et ANXA2. ANXA2 est une protéine impliquée dans la biogénèse et le transport endosomal. Nos résultats identifient un site de SUMOylation régulé par l’insuline dans sa région N-terminale. ATIC est une enzyme de la voie de synthèse des purines de novo dont le substrat AICAR est un activateur de l’AMPKα. Des analyses biochimiques in vitro et in vivo nous montrent que ATIC favorise la tyrosine phosphorylation du RI par opposition fonctionnelle à PTPLAD1. Une délétion partielle d’ATIC stimule l’activation de l’AMPK dont la sous-unité AMPKα2 apparaît déterminante pour le trafic du RI. Nous démontrons que ATIC, PTPLAD1, AMPKα, AICAR et ANXA2 contrôlent l’endocytose du RI à travers le cytosquelette d’actine et le réseau de microtubules. Nous ressortons un nœud de signalisation (ATIC, PTPLAD1, AMPKα) capable de détecter les niveaux d’activation du RI, d’énergie cellulaires (rapports AMP/ATP) et aussi d’agir sur la signalisation et l’endocytose du RI. Cette proximité moléculaire expliquerait le débat sur le mécanisme primaire du diabète de type 2 (DT2), notamment entre la sensibilité à l’insuline et sa clairance. Nous avons calculé un enrichissement de 61% de variants communs du DT2 parmi les protéines fonctionnellement proches du RI incluant RI, ATIC, AMPKα, KIF5A et GLUT2. Cet enrichissement suggère que l’hétérogénéité génétique révélée par les consortiums sur études génomiques (GWAS) converge vers des mécanismes peu étudiés de biologie cellulaire.The normal cell deals efficiently with multiple signals, processes (synthesis, secretion, trafficking, metabolism, and division), and energy and security problems. To achieve these goals, the cell uses large and relatively stable proteins nodes (or hubs) often sustained by adapters. It appears that the cell also uses small, dynamics nodes where informations about apparently unconnected major pathways are evaluated. Not only these informations are locally integrated but also a decision is made for immediate action. This is exemplified here by the insulin receptor (IR). This receptor-tyrosine kinase recognizes signals from the outside (circulating insulin) and engages insulin signalling activity and the insulin response. Quite simultaneously, the insulin receptor is involved in insulin internalization and its subsequent degradation in endosomes (clearance of circulating insulin) and thus, it indirectly regulates insulin secretion by the -cells of the endocrine pancreas. The physiological significance of trafficking and the molecular bases of such coordination have received little attention. We constructed hepatic Golgi/endosomes (G/E) network of the internalized IR (IRGEN) and we found substantial heterogeneity within the close environment of IR, with the presence of ATIC, a metabolic enzyme of the de novo purine synthesis pathway, the putative tyrosine phosphatase PTPLAD1, the energy sensor AMPK and ANXA2, a protein involved in endosomes biogenesis and endosomal transport. Our results show that ANXA2 is SUMOylated on an insulin-dependent way at a non-concensus motif of its N-terminal domain. It appears that following insulin stimulation, the proteins ATIC, PTPLAD1, AMPKα associate within seconds with the activated IR and control its tyrosine kinase activity and traffic. We found that PTPLAD1 and AMPKα are rapidly compartmentalised within the plasma membrane (PM) and G/E fractions after insulin stimulation and that ATIC accumulates in the G/E fraction later. By using an in vitro reconstitution system and siRNA–mediated partial knockdown of ATIC and PTPLAD1 in HEK293 cells, we confirmed that ATIC, PTPLAD1 and AMPKα affect IR tyrosine phosphorylation and endocytosis and treatment with AICAR, increased IR endocytosis in cultured cells and in the liver. These results suggest the presence of a new signalling mechanism that senses in the same time adenylate synthesis, cell energy (ATP) and IR activation states and that acts consequently in regulating IR autophosphorylation and endocytosis. The IRGEN may explain the perceived promiscuity that exists between insulin resistance and clearance, as this new signalling node apparently controls both the IR activity and trafficking. The elevated number of common heritable variants associated with type 2 diabetes (T2D) in the actual IRGEN (more than 61 %) favours the idea that the confusing genetic heterogeneity converges however towards few biological mechanisms

    Comparaison de réseaux biologiques

    Get PDF
    The comparison of biological networks is now one of the most promising approaches that help in understanding the functioning of living organisms. It appears as the expected continuation of the comparison of biological sequences, whose study represents in reality only the genomic aspect of the information manipulated by biologists. In this thesis, we propose an innovative approach allowing to compare two biological networks modeled respectively by a directed graph D and an undirected graph G, and provided with a correspondence function f between the vertices of both graphs. The approach consists in extracting automatically a biologically significant structure in D whose vertices induce in G a biologically significant structure as well. We realize an algorithmic study of the problem arising in our approach by starting with its variant in which D is acyclic (DAG). We provide polynomial algorithms for several cases and we show that other cases are algorithmically difficult (NP-completes). In order to solve the difficult instances, we propose a reliable heuristic and an exact algorithm based on the branch-and-bound method. To deal with the case where D is cyclic, we introduce a method motivated by biological hypotheses and consisting in decomposing D into DAGs such that the vertices of each DAG induce in G a connected subgraph. We also study in this thesis, the problem of signaling pathways inference by combining the information on causes and effects of extra-cellular events. We model this problem by a problem of mixed graphs orientation and we perform a complexity study allowing to identify the easy and the difficult instances.La comparaison de réseaux biologiques est actuellement l'une des approches les plus prometteuses pour aider à la compréhension du fonctionnement des organismes vivants. Elle apparaît comme la suite attendue de la comparaison de séquences biologiques dont l'étude ne représente en réalité que l'aspect génomique des informations manipulées par les biologistes. Dans cette thèse, nous proposons une approche innovante permettant de comparer deux réseaux biologiques modélisés respectivement par un graphe orienté D et un graphe non-orienté G, et dotés d'une fonction f établissant la correspondance entre les sommets des deux graphes. L'approche consiste à extraire automatiquement une structure dans D, biologiquement significative, dont les sommets induisent dans G, par f, une structure qui soit aussi biologiquement significative. Nous réalisons une étude algorithmique du problème issu de notre approche en commençant par sa version dans laquelle D est acyclique (DAG). Nous proposons des algorithmes polynomiaux pour certains cas, et nous montrons que d'autres cas sont algorithmiquement difficiles (NP-complets). Pour résoudre les instances difficiles, nous proposons une bonne heuristique et un algorithme exact basé sur la méthode branch-and-bound. Pour traiter le cas où D est cyclique, nous introduisons une méthode motivée par des hypothèses biologiques et consistant à décomposer D en DAGs tels que les sommets de chaque DAG induisent dans G un sous-graphe connexe. Nous étudions également dans cette thèse, l'inférence des voies de signalisation en combinant les informations sur les causes et sur les effets des événements extra-cellulaires. Nous modélisons ce problème par un problème d'orientation de graphes mixtes et nous effectuons une étude de complexité permettant d'identifier les instances faciles et celles difficiles

    Caractérisation intégrative et développement d’outils moléculaires chez la bactérie "Mesoplasma florum"

    Get PDF
    L’émergence de la biologie synthétique marque l’entrée dans une nouvelle ère où il sera possible de modifier et reprogrammer des génomes entiers afin de répondre à des besoins spécifiques. Ce domaine de recherche est par conséquent appelé à jouer un rôle de premier plan dans le développement de nouvelles technologies visant à s’attaquer à certains des plus grands défis du 21e siècle tels que la multirésistance aux antibiotiques, la production d’énergies renouvelables et le traitement de maladies comme le cancer ou le diabète. Notre habileté actuelle à programmer des comportements cellulaires prévisibles est cependant très limitée, principalement parce que les organismes modèles couramment utilisés possèdent une complexité qui dépasse nos capacités d’analyse et que les règles fondamentales qui gouvernent le fonctionnement global des cellules demeurent encore mal comprises. En raison de leurs génomes remarquablement petits, les bactéries appartenant à la classe des Mollicutes représentent des candidats particulièrement intéressants afin de décortiquer le fonctionnement intégral de cellules via les approches intégratives de la biologie des systèmes et de la génomique synthétique. La majorité de ces microorganismes sont toutefois caractérisés par un style de vie parasitaire, des capacités métaboliques réduites et une croissance relativement lente nécessitant l’utilisation de milieux de culture complexes. Conjointement au manque d’outils génétiques efficaces, ces caractéristiques restreignent considérablement leur manipulation en laboratoire. Certains Mollicutes se démarquent néanmoins en tant qu’organismes modèles pour l’avancement de la biologie synthétique et de la biologie des systèmes. C’est le cas pour Mesoplasma florum, une bactérie étroitement apparentée aux mycoplasmes du groupe de Mycoplasma mycoides (mycoides cluster). Contrairement à la plupart des mycoplasmes, M. florum ne possède aucun pouvoir pathogène connu et croît rapidement en conditions de laboratoire. De plus, M. florum possède un génome comprenant seulement 793 224 paires de bases et 685 séquences codantes pour des protéines, ce qui positionne cette bactérie parmi les organismes à réplication autonome les plus simples connus à ce jour. Malgré ces avantages considérables, seulement quelques études avaient jusqu’à tout récemment spécifiquement exploré la biologie de M. florum, et ce même si sa découverte remonte à près de 40 ans. Ainsi, lors du commencement de mon doctorat, plusieurs aspects importants concernant ce microorganisme demeuraient toujours à définir. Par exemple, pratiquement aucune donnée quantitative sur la physiologie de cette bactérie était à ce moment-là disponible dans la littérature, et aucune étude sur l’expression de ses gènes n’avait encore été entreprise. De plus, très peu voire même aucun outil moléculaire n’était disponible afin de modifier le génome de M. florum, ce qui constituait une limitation technique importante à l’étude de la biologie de cet organisme, en plus de restreindre son utilisation en tant que châssis cellulaire pour l’ingénierie microbienne et le développement d’applications biotechnologiques. Face à cette problématique, j’ai tout d’abord développé un système de culture en continu flexible et peu dispendieux permettant de faire croître M. florum dans des conditions contrôlées, stables et hautement reproductibles. Cet appareil offre plusieurs modes de fonctionnement pour accommoder les différents besoins rencontrés en laboratoire, et nous avons rendu les détails de sa conception entièrement disponibles pour l’ensemble de la communauté scientifique. En diminuant les fluctuations physiologiques des cellules, ce système de culture permet de réduire les variations expérimentales lors de l’étude de M. florum, et ainsi de générer des données plus facilement interprétables et comparables entre expériences. J’ai ensuite développé les tout premiers plasmides spécifiquement conçus pour se répliquer chez M. florum. Basés sur l’origine de réplication du chromosome, ces plasmides ont permis de tester la fonctionnalité de différents marqueurs de sélection aux antibiotiques, en plus de mettre au point différentes méthodes de transformation pour cette bactérie. Grâce à leur tendance naturelle à recombiner avec le chromosome, ces plasmides ont d’ailleurs servi de fondement à la technique développée par notre laboratoire afin de cloner le génome complet de M. florum dans la levure. Cette souche de levure peut maintenant servir de plateforme afin de modifier efficacement le génome de M. florum et ensuite le transplanter dans une cellule réceptrice. Finalement, j’ai procédé à la caractérisation approfondie de cette bactérie quasi minimale en combinant différentes méthodes expérimentales et approches intégratives. Cette caractérisation intégrative comprend la mesure de plusieurs aspects physiques et physiologiques propres à M. florum, incluant son temps de doublement, diamètre cellulaire, masse cellulaire sèche, ainsi que la définition des fractions macromoléculaires de celle-ci. J’ai également réalisé les premières analyses du transcriptome et du protéome de ce microorganisme afin de définir les unités transcriptionnelles, estimer les abondances moléculaires absolues de chacun des transcrits et protéines exprimées, de même qu’évaluer l’importance globale des fonctions cellulaires prédites. En plus d’augmenter nos connaissances fondamentales sur différents aspects de la biologie de M. florum, ces efforts de caractérisation serviront de fondation pour le développement d’un modèle à l’échelle du génome décrivant le métabolisme de cette bactérie. L’ensemble de ces efforts visent à acquérir les connaissances et les outils moléculaires nécessaires afin de transformer M. florum en une plateforme simplifiée, hautement caractérisée et spécialement conçue pour explorer les règles gouvernant l’organisation et la plasticité des génomes, ainsi que les mécanismes cellulaires à la base du fonctionnement des cellules. Une telle plateforme a le potentiel de transformer la biologie synthétique en une discipline logique, prévisible et reproductible, rendant ainsi possible le prototypage rationnel et efficace de génomes dans le but de produire des souches bactériennes capables d’accomplir des tâches bien précises

    Conception d'un web service pour la fouille de données de génomique : application à la caractérisation de la myogenèse et de l'adipogenèse

    Get PDF
    The quality of carcasses and meats depends on the balance between muscle and adipose tissue (AT) masses that determine carcass weight and performance (muscle and fat composition), but also the sensory quality of the meat (tenderness, juiciness and flavor). Understanding how to control the ratio of muscle mass relative to AT mass represents a major challenge for beef producers. The balance between these masses depends on the number and volume of muscle and AT cells. These cellular events are taking place at the early steps of fetal period in cattle, as the total number of muscle cells is fixed at 180 days post-conception (dpc) in the fetus. The analysis of the evolution of these two proteome tissues during fetal life produced original but insufficient data. In addition, it is not always easy to extract or generate relevant biological information from genomic experiments. This is particularly true in ruminant species because they are not annotated in databases and few bioinformatic resources are dedicated to them. In this context, our objective was to design an “all in one” web service to analyze genomic data in cattle in order to improve knowledge of the mechanisms involved in fetal muscle and AT growth. Thus, we have organized our thesis in two axes. We developed a genomic data analysis tool, dedicated to ruminant species (cattle, sheep and goat) and named ProteINSIDE (www.proteinside.org). In a single query, this tool synthesizes the biological information stored in public databases or provided by functional annotations from gene ontology. It also predicts proteins that are secreted (tissue secretome) and which are involved in signaling between cells or tissues. It links proteins according to their molecular interactions to identify and visualize those that contribute to the same biological processes and those that are central to a biological process. ProteINSIDE was tested with data sets of 1000 proteins by species and has been successfully compared with DAVID, BioMyn, and AgBase (designed for information retrieval and annotation), as well as PrediSi and Phobius (that predict proteins secreted). We applied ProteINSIDE to the proteome analysis of muscle and AT. A first analysis of data on the ontogenesis of the tissue revealed links between proteins of both fetal tissues and proteins involved in autophagy processes. In a second study, we constructed and described the bovine proteomes of both tissues at 140 dpc. We identified 514 muscle protein and 752 AT proteins, including 346 commons proteins. As an example, these proteins are involved in the negative regulation of apoptosis, in autophagy processes, in the regulation of cell proliferation, and in the Wnt signaling pathway. We identified 47 and 93 potentially secreted proteins by muscle and TA, including 24 commons proteins. The integration of knowledges about the secreted proteins with those available for the “surfaceome” suggested proteins which could participate in the cross-talk between muscle and AT. Thus, we produced a web server to mine genomic data from bovine, sheep, and goat species, but also from human, rat and mice species. This type of server should be particularly useful to the scientific community. Its implementation has led to the production of new knowledge and working hypotheses for the understanding of the mechanisms which regulate fetal growth of muscle and AT.La qualité des carcasses et des viandes bovines dépend de l’équilibre entre les masses musculaires et adipeuses qui conditionnent le poids de carcasse et son rendement (composition en muscle et en gras), mais aussi la qualité sensorielle de la viande (tendreté, jutosité et flaveur). Comprendre comment contrôler le rapport des masses de muscle relativement à celles des tissus adipeux (TA) représente donc un enjeu majeur pour les filières de viande bovine. Ce rapport dépend du nombre et du volume des cellules musculaires et adipeuses. Ces propriétés sont sous le contrôle d’événements cellulaires se mettant en place précocement chez le bovin puisque le nombre de cellules musculaires est fixé dès l’âge 180 jours post-conception (jpc) chez le fœtus. Des analyses de l’évolution des protéomes de ces deux tissus, au cours de la vie fœtale ont produit des données originales mais insuffisantes. En outre, il n’est pas toujours aisé d’extraire ou de générer une information biologique pertinente à partir d’expérimentations de génomique. Ceci est particulièrement vrai chez les ruminants, car ils sont peu annotés dans les bases de données et peu de ressources bioinformatiques leur sont dédiées. Dans ce contexte, notre objectif était de concevoir un serveur web « tout en un » permettant une fouille des données de génomique chez le bovin afin d’améliorer les connaissances sur les mécanismes associés à la croissance par hyperplasie et par hypertrophie des tissus musculaire et adipeux. Aussi, nous avons organisé notre travail de thèse en deux axes.Un outil d’analyse de données de génomique, dédié aux ruminants (bovin, ovin et caprin) nommé ProteINSIDE (www.proteinside.org) a été développé. En une seule requête, il synthétise l'information biologique stockée dans les bases de données publiques ou fournie par les annotations fonctionnelles issues de l’ontologie des gènes. Il prédit aussi les protéines qui sont sécrétées (sécrétome des tissus) et qui interviennent dans la signalisation entre les cellules ou tissus. Il lie les protéines selon leurs interactions moléculaires afin d’identifier et de visualiser celles qui contribuent à un même processus biologique et celles qui sont centrales à un processus biologique. ProteINSIDE a été testé avec des jeux de données de 1000 protéines par espèce et a été comparé avec succès à DAVID, BioMyn et AgBase, conçus pour la recherche d'information et l'annotation, ainsi qu'à PrediSi et Phobius qui prédisent les protéines sécrétées. ProteINSIDE a été appliqué à l’analyse des protéomes des tissus musculaires et adipeux. Une première analyse des données relatives à l’ontogenèse des tissus, a révélé des liens entre des protéines présentes dans les deux tissus fœtaux et des protéines impliquées dans les processus d’autophagie. Dans une seconde étude, nous avons décrit les protéomes des deux tissus à 140 jpc. Nous avons identifié 514 protéines musculaires et 752 protéines adipeuses, dont 346 communes. Ces protéines interviennent par exemple dans la régulation négative de l’apoptose, dans les processus d’autophagie, dans la régulation de la prolifération cellulaire et dans la voie de signalisation Wnt. Nous avons identifié 47 et 93 protéines potentiellement sécrétées par le muscle et le TA, dont 24 communes. L’intégration des connaissances sur les protéines sécrétées avec celles disponibles pour le « surfaceome » a suggéré des protéines qui participeraient au dialogue muscle-TA. Nous avons donc produit un serveur web pour la fouille de données de génomique non seulement chez le bovin, l’ovin, le caprin, mais aussi chez l’homme, le rat et la souris. Ce type de serveur devrait être particulièrement utile à la communauté scientifique. Son application a conduit à la production de connaissances nouvelles et d’hypothèses de travail pour la compréhension des mécanismes de régulation de la croissance fœtale du muscle squelettique et du tissu adipeux

    Développement de méthodes et outils d'analyse transcriptomique par réseaux de co-expression de gènes pour la détection de gènes candidats dans le vieillissement de différents tissus humains

    Get PDF
    L'analyse par réseau de co-expression de gènes est un outil entré il y a 15 ans dans l'ensemble des outils disponibles pour l'analyse transcriptomique. En étudiant la variation de synchronisation de l'expression des gènes, cet outil permet de révéler de nouveaux gènes impliqués dans des maladies ou phénotypes dont l'expression seule n'est pas significativement différente. Il est également capable de détecter des groupes de gènes, ou modules, interagissant préférentiellement et sur lesquels il est possible d'effectuer une exploration étendue. Il est ainsi possible d'utiliser des méthodes avec injection de connaissance préalable comme l'enrichissement de gènes ou l'association phénotypique, ou des méthodes guidées par les données comme l'analyse topologique ou la co-expression différentielle. Pourtant, ce type d'analyse reste sous exploitée actuellement par rapport à son potentiel, et notamment dans certaines maladies ou phénotypes où l'altération est une désorganisation du système comme le vieillissement. Afin de faciliter à tout chercheur l'emploi de cette méthode, un progiciel R disponible sur Bioconductor et nommé GWENA a été développé. Organisé comme un pipeline d'analyse simplifié et allant de la construction du réseau jusqu'à l'aide à l'interprétation des modules entre différentes conditions, c'est également le seul pipeline actuel à intégrer la co-expression différentielle. Pour assister l'utilisateur, il comprend de nombreux avertissements sur l'intégrité des données rentrées et sur la plausibilité des résultats. Afin d'éviter de devoir recourir à d'autres logiciels, il contient également un système de visualisation des réseaux. Enfin, GWENA est un outil dont l'architecture modulaire lui permettra d'évoluer avec le temps. L'efficacité de GWENA a été démontrée dans une première étude du vieillissement du muscle squelettique humain où un sous ensemble de gènes a été priorisé pour l'étude de la sarcopénie. Il a également permis de préciser une topologie du réseau spécifique du vieillissement et observée auparavant : la perte de connectivité du réseau, ou déconnexion. En effet, parallèlement à la déconnexion, il a été constaté grâce à GWENA une reconnexion locale située au niveau des gènes pivots. Pour étudier cette topologie à large échelle, l'analyse a été répétée sur un ensemble élargi de tissus humains. Par un recoupement des modules différentiellement exprimés, des phénomènes communs du vieillissement entre tissus sont apparus ainsi que des phénomènes spécifiques à certains tissus. L'analyse topologique, notamment de la déconnexion, des gènes inclus dans ces recoupements pour deux exemples, un phénomène commun et un phénomène spécifique, a à son tour permis la priorisation de gènes encore mal étudiés ou inconnus dans ces phénomènes. En finalité, les travaux présentés au cours de cette thèse auront amené à la création d'un outil utile à la communauté de biologistes comme bio-informaticiens pour faciliter l'accès à une analyse à a haut potentiel dans l'analyse du vieillissement et toute autre condition, notamment celles axées sur la dérégulation de l'expression systémique.Gene co-expression network analysis is a tool that entered the transcriptomics analysis toolbox 15 years ago. By studying the variation in the synchronization of gene expression, this tool can reveal new genes involved in diseases or phenotypes whose expression alone is not significantly different. It is also able to detect groups of genes, or modules, that interact preferentially and on which it is possible to carry out an extended exploration. It is therefore possible to use knowledge-driven methods such as gene enrichment or phenotypic association, or data-driven methods such as topological analysis or differential co-expression. Nevertheless, this type of analysis is currently under-exploited compared to its potential, especially in certain diseases or phenotypes where the alteration is a disorganization of the system such as aging. In order to facilitate the use of this method by any researcher, an R software package available on Bioconductor and named GWENA has been developed. Organized as a simplified analysis pipeline from the construction of the network to the interpretation of the modules between different conditions, it is also the only current pipeline to integrate the differential co-expression. To assist the user, it includes numerous warnings about the integrity of the data entered and the plausibility of the results. In order to avoid having to use other software, it also contains a network visualization system. Finally, GWENA is a tool whose modular architecture allows it to evolve overtime. The effectiveness of GWENA has been demonstrated in a first study of human skeletal muscle aging, where a subset of genes was prioritized for the study of sarcopenia. It also allowed to clarify a network topology specific to aging and previously observed: the loss of network connectivity, or disconnection. Indeed, in parallel to the disconnection, a local reconnection located at the level of hub genes was observed thanks to GWENA. To study this topology on a large scale, the analysis was repeated on an extended set of human tissues. By cross-referencing differentially expressed modules, common aging phenomena between tissues were identified as well as tissue-specific phenomena. Topological analysis, including disconnection, of the genes included in these overlaps for two examples, a common and a specific phenomenon, in turn allowed the prioritization of genes still poorly studied or unknown in these phenomena. Overall, the work presented in this thesis will have led to the creation of a useful tool for the community of biologists as bioinformaticians to facilitate access to a high-potential analysis in the analysis of aging and any other condition, especially those focused on the deregulation of systemic expression

    Étude des fonctions développementales et métaboliques du récepteur nucléaire fetoprotein transcription factor (FTF)

    Get PDF
    Le récepteur nucléaire Fetoprotein Transcription Factor (FTF) identifié par notre laboratoire et exprimé principalement dans le système digestif est un régulateur important du métabolisme des lipides et des stéroïdes, de la prolifération cellulaire et du développement embryonnaire. Plusieurs groupes ont constaté que l’influence du récepteur FTF sur la synthèse de stéroïdes et la régulation du cycle cellulaire stimule la prolifération tumorale de cellules d’origine tissulaire diverse. Mes études de doctorat ont porté sur l’expression tissulaire de FTF, sur la caractérisation d’un nouvel élément régulateur de son promoteur et sur l’identification par immunoprécipitation de chromatine (ChIP-chip) des cibles transcriptionnelles de FTF dans le foie de souris fœtale et adulte et dans les cellules d’hépatome humain. Ces études ont permis de mieux définir le rôle métabolique de FTF ainsi que son rôle développemental et son implication potentielle dans la carcinogenèse hépatique. L’expression de FTF par les organes du système digestif et par certaines structures nerveuses, sa régulation par des récepteurs nucléaires métaboliques et sa liaison aux promoteurs de multiples enzymes et transporteurs impliqués dans le métabolisme énergétique placent FTF dans une position clé dans l’homéostasie métabolique et énergétique de l’organisme. Le facteur de transcription C/EBPpartenaire de FTF au promoteur de l’AFP et impliqué lui aussi dans le développement hépatique et le métabolisme énergétique, est lié au promoteur de 20% des cibles transcriptionnelles de FTF. De plus, C/EBP lie le promoteur de FTF formant ainsi une autre boucle activatrice s’ajoutant au réseau transcriptionnel hépatique. Dans les cellules d’hépatome, FTF lie les promoteurs de plusieurs gènes impliqués dans la prolifération et le maintien des cellules tumorales, soit des régulateurs de la réplication, de la croissance et de l’apoptose cellulaire. FTF fait donc partie intégrante du réseau transcriptionnel hépatique régissant le développement et la différenciation hépatique et le maintien du métabolisme énergétique chez l’adulte et est vraisemblablement impliqué dans la promotion de la cancérogenèse hépatique.FTF is a nuclear receptor principally expressed in adult digestive organs that has been shown to act as a major regulator of lipids and steroids metabolism, cellular proliferation and embryonic development. FTF involvement in steroid synthesis and cell cycle regulation tends toward the stimulation of tumor proliferation in neoplasic tissues in which FTF is expressed. However, more studies of FTF function in normal and disease states and on its regulation are needed to draw a complete picture of FTF activity in cell physiology. Within the context of my studies, I delineated the FTF adult and fetal tissular expression, characterized a novel Ftf promoter element and identified FTF direct hepatic transcriptional targets in fetal, adult and tumor cell lines by using chromatin immunoprecipitation (ChIP-on-chip). These studies defined new FTF functions in metabolism, fetal development and hepatic carcinogenesis. FTF expression in digestive system and in neural structures controlling eating behavior, its transcriptional regulation by metabolic nuclear receptors and its binding to enzyme and transporter gene promoters driving energy metabolism, puts FTF in a key location for governing cellular and organismal energy metabolism. C/EBP, a transcriptional FTF partner on the Afp gene promoter and also involved in energy metabolism, is bound to 20% of the FTF targets including FTF itself thus adding branches to the complex hepatic transcriptional network. In hepatoma cells, FTF binds to proliferation and tumor cell maintenance genes like replication, growth and apoptosis regulators. Therefore, FTF belongs to the hepatic transcription network that governs hepatic development, differentiation and adult energy metabolism and is likely to be involved in promoting hepatic tumorogenesis

    Rétroactions positives et mémoire cellulaire (exemples dans l'expression génétique et le métabolisme cellulaire)

    Get PDF
    Au-delà de l'information génétique contenue dans la séquence de l'ADN des cellules, il existe une mémoire cellulaire, dite épigénétique comprenant l'ensemble des circuits génétiques avec rétroactions positives permettant d'amplifier ou de maintenir une réponse cellulaire dans le temps. Nous nous sommes intéressés, à travers deux exemples, aux boucles de rétrocontrôle positif comme élément de réponse à un signal, permettant de fixer, de manière à la fois dynamique et robuste, le comportement cellulaire. Dans un premier temps, nous avons identifié une boucle d'auto-amplification dans la production de vitellogénine chez la truite et permettant d'expliquer l' effet mémoire de la vitellogénèse (une seconde stimulation à l'œstradiol induit une plus forte production de vitellogénine et plus rapidement que lors de la première stimulation, alors même que le niveau de vitellogénine retombe à zéro entre les deux stimulations). Le modèle que nous proposons implique un récepteur tronqué à l'œstradiol possédant une activité basale même en l'absence de son ligand, permettant de maintenir la cellule dans un état d'aptitude à répondre sans pour autant produire de vitellogénine. Dans un deuxième temps, nous nous sommes intéressés à une des causes possibles provoquant la transition épithélio-mésenchymateuse (EMT), responsable des métastases dans les cancers. L'EMT témoigne d'un état plus agressif des cellules tumorales et s'accompagne notamment d'un changement du métabolisme des cellules cancéreuses, diminuant la part de la phosphorylation oxydative au profit de la glycolyse (effet Warburg). Cela entraîne une baisse d'efficacité de la production d'ATP, obligeant les cellules à prélever davantage de nutriments dans leur milieu. Cette observation a suscité le développement de thérapies basées sur la privation de glucose et qui, a priori, devraient nuire principalement aux cellules cancéreuses. Nous avons étudié les effets d'un faible contenu cellulaire en ATP sur la transformation cellulaire. Nous avons observé qu'un traitement par un analogue non métabolisable du glucose diminue drastiquement le contenu en ATP des cellules ayant passé l'EMT et induit des changements morphologiques et génétiques orientés vers le phénotype mésenchymateux. La protéine MKL1, cofacteur de transcription dont l'activité est régulée par la polymérisation de l'actine, pourrait être un relais génétique entre l'état métabolique cellulaire et le maintien de l'EMT. Ces résultats suggèrent de fortes connections entre l'EMT et le niveau énergétique des cellules, faisant d'une privation d'énergie une cause possible de l'aggravation du phénotype mésenchymateux et remettant en cause les bienfaits sur le long terme de thérapies visant à affamer les cellules tumorales.Beyond the genetic information contained in the DNA sequence of cells, there is a cellular memory called epigenetic, including genetic circuits with positive feedback loops amplifying or maintaining cellular states in time. We studied through two examples, the positive feedback loops as part of response to a signal, able to set cell behavior, in a dynamic and robust way. As a first step, we identified a self-amplification loop in the production of trout vitellogenin explaining the "vitellogenesis memory effect" (a second estradiol stimulation induces higher and faster vitellogenin production than during the first stimulation, even though the vitellogenin level falls to zero between the two stimuli). The model we propose involves a truncated estradiol receptor, with a basal activity even in the absence of its ligand, which is able to maintain the cell in an estrogen-responsive state without producing vitellogenin. In a second step, we studied one of the possible causes leading to the epithelial-mesenchymal transition (EMT), involved in cancer metastasis. The EMT reflects a more aggressive state of tumor cells and is associated with a particular change in the metabolism of cancer cells, reducing the part of oxidative phosphorylation in favor of glycolysis (Warburg effect). This leads to a reduction in the efficiency of ATP production, forcing the cells to take more nutrients from their environment. This observation led to the development of treatments based on glucose deprivation which should mainly affect cancer cells. We studied the effects of a low cellular ATP content on cell transformation. We observed that a treatment with a non-metabolizable glucose analogue drastically reduces the ATP content of cells that had undergone EMT and induces morphological and genetic changes enforcing the mesenchymal phenotype. We identified the transcriptional coactivator MKL1, whose activity is regulated by actin polymerization, as a possible genetic link between the cellular metabolic state and maintenance of EMT. These results suggest strong connections between the EMT and the energy level of the cells, and raise serious questions about the benefits of the long-term therapy "starving" tumor cells, considering that energy deprivation could aggravate the mesenchymal cell phenotype.RENNES1-Bibl. électronique (352382106) / SudocSudocFranceF

    Identification des réseaux transcriptionnnels de résistance aux antifongiques chez Candida albicans

    Get PDF
    Plusieurs souches cliniques de Candida albicans résistantes aux médicaments antifongiques azolés surexpriment des gènes encodant des effecteurs de la résistance appartenant à deux classes fonctionnelles : i) des transporteurs expulsant les azoles, CDR1, CDR2 et MDR1 et ii) la cible des azoles 14-lanostérol déméthylase encodée par ERG11. La surexpression de ces gènes est due à la sélection de mutations activatrices dans des facteurs de transcription à doigts de zinc de la famille zinc cluster (Zn2Cys6) qui contrôlent leur expression : Tac1p (Transcriptional activator of CDR genes 1) contrôlant l’expression de CDR1 et CDR2, Mrr1p (Multidrug resistance regulator 1), régulant celle de MDR1 et Upc2p (Uptake control 2), contrôlant celle d’ERG11. Un autre effecteur de la résistance clinique aux azoles est PDR16, encodant une transférase de phospholipides, dont la surexpression accompagne souvent celle de CDR1 et CDR2, suggérant que les trois gènes appartiennent au même régulon, potentiellement celui de Tac1p. De plus, la régulation transcriptionnelle du gène MDR1 ne dépend pas seulement de Mrr1p, mais aussi du facteur de transcription de la famille basic-leucine zipper Cap1p (Candida activator protein 1), un régulateur majeur de la réponse au stress oxydatif chez C. albicans qui, lorsque muté, induit une surexpression constitutive de MDR1 conférant la résistance aux azoles. Ces observations suggèrent qu’un réseau de régulation transcriptionnelle complexe contrôle le processus de résistance aux antifongiques azolés chez C. albicans. L’objectif de mon projet au doctorat était d’identifier les cibles transcriptionnelles directes des facteurs de transcription Tac1p, Upc2p et Cap1p, en me servant d’approches génétiques et de génomique fonctionnelle, afin de i) caractériser leur réseau transcriptionnel et les modules transcriptionnels qui sont sous leur contrôle direct, et ii) d’inférer leurs fonctions biologiques et ainsi mieux comprendre leur rôle dans la résistance aux azoles. Dans un premier volet, j’ai démontré, par des expériences de génétique, que Tac1p contrôle non seulement la surexpression de CDR1 et CDR2 mais aussi celle de PDR16. Mes résultats ont identifié une nouvelle mutation activatrice de Tac1p (N972D) et ont révélé la participation d’un autre régulateur dans le contrôle transcriptionnel de CDR1 et PDR16 dont l’identité est encore inconnue. Une combinaison d’expériences de transcriptomique et d’immunoprécipitation de la chromatine couplée à l’hybridation sur des biopuces à ADN (ChIP-chip) m’a permis d’identifier plusieurs gènes dont l’expression est contrôlée in vivo et directement par Tac1p (PDR16, CDR1, CDR2, ERG2, autres), Upc2p (ERG11, ERG2, MDR1, CDR1, autres) et Cap1p (MDR1, GCY1, GLR1, autres). Ces expériences ont révélé qu’Upc2p ne contrôle pas seulement l’expression d’ERG11, mais aussi celle de MDR1 et CDR1. Plusieurs nouvelles propriétés fonctionnelles de ces régulateurs ont été caractérisées, notamment la liaison in vivo de Tac1p aux promoteurs de ses cibles de façon constitutive et indépendamment de son état d’activation, et la liaison de Cap1p non seulement à la région du promoteur de ses cibles, mais aussi celle couvrant le cadre de lecture ouvert et le terminateur transcriptionnel putatif, suggérant une interaction physique avec la machinerie de la transcription. La caractérisation du réseau transcriptionnel a révélé une interaction fonctionnnelle entre ces différents facteurs, notamment Cap1p et Mrr1p, et a permis d’inférer des fonctions biologiques potentielles pour Tac1p (trafic et la mobilisation des lipides, réponse au stress oxydatif et osmotique) et confirmer ou proposer d’autres fonctions pour Upc2p (métabolisme des stérols) et Cap1p (réponse au stress oxydatif, métabolisme des sources d’azote, transport des phospholipides). Mes études suggèrent que la résistance aux antifongiques azolés chez C. albicans est intimement liée au métabolisme des lipides membranaires et à la réponse au stress oxydatif.Many azole resistant Candida albicans clinical isolates overexpress genes encoding azole resistance effectors that belong to two functional categories: i) CDR1, CDR2 and MDR1, encoding azole-efflux transporters and ii) ERG11, encoding the target of azoles 14-lanosterol demethylase. The constitutive overexpression of these genes is due to activating mutations in transcription factors of the zinc cluster family (Zn2Cys6) which control their expression. Tac1p (Transcriptional activator of CDR genes 1), controlling the expression of CDR1 and CDR2, Mrr1p (Multidrug resistance regulator 1), regulating MDR1 expression and Upc2p (Uptake control 2), controlling the expression of ERG11. Another determinant of clinical azole resistance is PDR16, encoding a phospholipid transferase, whose overexpression often accompanies that of CDR1 and CDR2 in clinical isolates, suggesting that the three genes belong to the same regulon, potentially that of Tac1p. Further, MDR1 expression is not only regulated by Mrr1p, but also by the basic-leucine zipper transcription factor Cap1p (Candida activator protein 1), which controls the oxidative stress response in C. albicans and whose mutation confers azole resistance via MDR1 overexpression. These observations suggest that a complex transcriptional regulatory network controls azole resistance in C. albicans. My Ph.D. studies are aimed at identifying the direct transcriptional targets of Tac1p, Upc2p and Cap1p using genetics and functional genomics approches in order to i) characterize their regulatory network and the transcriptional modules under their direct control and ii) infer their biological functions and better understand their roles in azole resistance. In the first part of my studies, I showed that Tac1p does not only control the expression of CDR1 and CDR2, but also that of PDR16. My results also identified a new activating mutation in Tac1p (N972D) and revealed that the expression of CDR1 and PDR16 is under the control of another yet unknown regulator. The combination of transcriptomics and genome-wide location (ChIP-chip) approaches allowed me to identify the in vivo direct targets of Tac1p (PDR16, CDR1, CDR2, ERG2, others), Upc2p (ERG11, ERG2, MDR1, CDR1, others) and Cap1p (MDR1, GCY1, GLR1, others). These results also revealed that Upc2p does not only control the expression of ERG11 but also that of MDR1 and CDR1. Many new functional features of these transcription factors were found, including the constitutive binding of Tac1p to its targets under both activating and non-activating conditions, and the binding of Cap1p which extends beyond the promoter region of its target genes, to cover the open reading frame and the putative transcription termination regions, suggesting a physical interaction with the transcriptional machinery. The characterization of the transcriptional regulatory network revealed a functional interaction between these factors, notably between Cap1p and Mrr1p, and inferred potential biological functions for Tac1p (lipid mobilization and traffic, response to oxidative and osmotic stress) and confirmed or suggested other functions for Upc2p (sterol metabolism) and Cap1p (oxidative stress response, regulation of nitrogen utilization and phospholipids transport). Taken together, my results suggest that azole resistance in C. albicans is tightly linked to membrane lipid metabolism and oxidative stress response
    • …
    corecore