11 research outputs found
ModĂ©lisation mĂ©tabolique Ă lâĂ©chelle du gĂ©nome de la bactĂ©rie quasi-minimale Mesoplasma florum
Des avancĂ©es significatives au niveau de la synthĂšse et de lâassemblage de fragments dâacide dĂ©soxyribonuclĂ©ique (ADN), le support physique des fonctions cellulaires encodĂ©es dans une cellule vivante, permettent maintenant la construction de gĂ©nomes entiers. Ce progrĂšs permet dâimaginer que la conception dâorganismes synthĂ©tiques deviendra routiniĂšre au cours des prochaines annĂ©es. Cette capacitĂ© promet de transformer radicalement le domaine de la biologie en formant une nouvelle discipline dâingĂ©nierie biologique. Parmi les retombĂ©es anticipĂ©es, on note le remplacement de synthĂšses chimiques par des procĂ©dĂ©s biologiques renouvelables tels que la production de biocarburants, la synthĂšse de mĂ©dicaments microbiens, ou des approches alternatives pour le traitement des maladies.
Dans ce contexte, il devient particuliĂšrement important dâarriver Ă prĂ©dire correctement le phĂ©notype rĂ©sultant des gĂ©nomes qui seront gĂ©nĂ©rĂ©s. Pour y arriver, il convient de rĂ©duire la complexitĂ© biologique en travaillant dâabord avec les cellules les plus simples possibles. Ce type dâorganisme ayant subi un processus de rĂ©duction de gĂ©nome et dont la majoritĂ© des gĂšnes sont essentiels afin de survivre en conditions dĂ©finies se nomme une cellule minimale. Le groupe phylogĂ©nĂ©tique des mollicutes, bactĂ©ries dĂ©pourvues de paroi cellulaire, contient les espĂšces vivant avec les plus petits gĂ©nomes connus Ă ce jour. Membre de ce groupe, le pathogĂšne humain Mycoplasma genitalium possĂšde le plus petit gĂ©nome capable de croissance autonome (560kbp codant pour 482 protĂ©ines. Cependant, sa pathogĂ©nicitĂ© et sa vitesse de croissance rĂ©duite (~24h) limitent lâapplicabilitĂ© de M. genitalium en biologie synthĂ©tique.
Pour remĂ©dier Ă ce problĂšme, notre laboratoire a choisi de travailler avec Mesoplasma florum dont le temps de doublement est trĂšs rapide (~32 min) et qui ne cause pas de maladies chez lâhumain. Les travaux effectuĂ©s chez M. florum permettent maintenant le clonage et la transplantation de son gĂ©nome et des travaux rĂ©cents ont permis de caractĂ©riser les propriĂ©tĂ©s physico-chimiques de sa cellule ainsi que plusieurs paramĂštres biologiques. Afin de permettre la conception de gĂ©nomes synthĂ©tiques basĂ©s sur M. florum, il convient dâintĂ©grer un maximum de connaissances dans un cadre informatique structurĂ© capable de gĂ©nĂ©rer des prĂ©dictions phĂ©notypiques. Un modĂšle mĂ©tabolique Ă lâĂ©chelle du gĂ©nome (GEM) reposant sur la mĂ©thode dâanalyse des flux Ă lâĂ©quilibre (FBA) reprĂ©sente un format particuliĂšrement intĂ©ressant pour initier ces travaux de biologie des systĂšmes.
La qualitĂ© des prĂ©dictions gĂ©nĂ©rĂ©es par ce type de modĂšle est dĂ©pendante de la prĂ©cision de lâobjectif Ă atteindre. Pour simuler la croissance, les GEMs doivent satisfaire un objectif nommĂ© âfonction objective de biomasseâ (BOF) qui contient lâensemble des mĂ©tabolites nĂ©cessaires Ă la production dâune nouvelle cellule avec des coefficients stĆchiomĂ©triques reprĂ©sentatifs de lâabondance de ces composantes dans la cellule. Pendant mon parcours de doctorat, jâai dĂ©veloppĂ© le logiciel BOFdat qui permet la dĂ©finition dâune BOF reprĂ©sentative de la composition cellulaire spĂ©cifique Ă une espĂšce avec les donnĂ©es expĂ©rimentales associĂ©es. Les deux premiĂšres des trois Ă©tapes de BOFdat dĂ©terminent les coefficients stoechiomĂ©triques de molĂ©cules connues pour faire partie de la composition cellulaire telles que les macromolĂ©cules principales (Ă©tape 1, ADN, ARN et protĂ©ines) et les coenzymes essentiels (Ă©tape 2). LâĂ©tape 3 de BOFdat propose une mĂ©thode non-biaisĂ©e pour dĂ©terminer les mĂ©tabolites susceptibles dâamĂ©liorer la prĂ©diction dâessentialitĂ© des gĂšnes formulĂ©e par le modĂšle. Pour ce faire, un algorithme gĂ©nĂ©tique maximise la composition de la biomasse en fonction des donnĂ©es dâessentialitĂ© expĂ©rimentales Ă lâĂ©chelle du gĂ©nome. BOFdat a Ă©tĂ© validĂ© en reconstruisant la BOF du modĂšle iML1515 de la bactĂ©rie modĂšle Escherichia coli. Lâutilisation de BOFdat a permis de rĂ©capituler le taux de croissance prĂ©dit avec la BOF originale tout en amĂ©liorant la qualitĂ© des prĂ©dictions dâessentialitĂ© de gĂšnes de iML1515. BOFdat est disponible en libre accĂšs pour quiconque dĂ©sire construire une BOF pour un modĂšle mĂ©tabolique.
Ensuite, un GEM nommĂ© iJL208 a Ă©tĂ© produit et contient 208 des 676 protĂ©ines reprĂ©sentant lâensemble du mĂ©tabolisme de M. florum. La qualitĂ© de lâannotation du gĂ©nome a dâabord Ă©tĂ© Ă©valuĂ©e en intĂ©grant lâinformation obtenue par trois approches bio-informatiques, rĂ©vĂ©lant que la majoritĂ© des protĂ©ines (418/676) ont une qualitĂ© suffisante pour ĂȘtre incorporĂ©es dans le modĂšle. Ensuite, les rĂ©actions ont Ă©tĂ© identifiĂ©es et rigoureusement incorporĂ©es une Ă la fois afin de construire le rĂ©seau mĂ©tabolique de cette bactĂ©rie quasi-minimale. LâĂ©tude de la carte mĂ©tabolique reconstruite rĂ©vĂšle une dĂ©pendance prononcĂ©e pour lâimport de composantes Ă partir du milieu de culture ainsi que lâimportance des mĂ©canismes de recyclage des mĂ©tabolites. Pour sa production dâĂ©nergie, M. florum est entiĂšrement dĂ©pendante de la glycolyse et ne possĂšde pas la machinerie nĂ©cessaire Ă la respiration cellulaire. LâĂ©laboration dâun milieu de culture semi-dĂ©fini a rĂ©duit la prĂ©sence de sucres contaminants dans le milieu de culture initial et ainsi de distinguer la croissance avec ou sans supplĂ©mentation de sucrose. Cette avancĂ©e importante a permis de mesurer les taux dâassimilation de sucrose et de production des dĂ©chets mĂ©taboliques lactate et acĂ©tate. Ces paramĂštres ont Ă©tĂ© utilisĂ©s afin de contraindre le modĂšle et de mieux comprendre la sensibilitĂ© du modĂšle Ă une variĂ©tĂ© de paramĂštres. Aussi, la croissance de M. florum a pu ĂȘtre validĂ©e expĂ©rimentalement avec diffĂ©rents sucres. Lâinformation contextuelle obtenue, combinĂ©e Ă une analyse de structures tridimensionnelles de protĂ©ines clĂ©s, a permis de suggĂ©rer des hypothĂšses crĂ©dibles supportant lâassimilation de ces sucres par M. florum.
Finalement, iJL208 a Ă©tĂ© utilisĂ© afin de formuler une prĂ©diction de gĂ©nome minimal pour M. florum en simulant itĂ©rativement de larges dĂ©lĂ©tions dans son gĂ©nome. Combiner lâintĂ©gration de donnĂ©es expĂ©rimentales avec les prĂ©dictions du modĂšle constitue une voie dâavenir pour la conception de gĂ©nomes synthĂ©tiques qui rejoint les capacitĂ©s techniques dâassemblage de chromosomes en biologie synthĂ©tique. Globalement, les projets rĂ©alisĂ©s au cours de mon doctorat contribuent Ă lâavancement de la biologie des systĂšmes chez M. florum dans le but de prĂ©dire efficacement les phĂ©notypes de la souche naturelle et de variants synthĂ©tiques qui pourront ĂȘtre produits au cours des prochaines annĂ©es
BOFdat: Generating biomass objective functions for genome-scale metabolic models from experimental data
<div><p>Genome-scale metabolic models (GEMs) are mathematically structured knowledge bases of metabolism that provide phenotypic predictions from genomic information. GEM-guided predictions of growth phenotypes rely on the accurate definition of a biomass objective function (BOF) that is designed to include key cellular biomass components such as the major macromolecules (DNA, RNA, proteins), lipids, coenzymes, inorganic ions and species-specific components. Despite its importance, no standardized computational platform is currently available to generate species-specific biomass objective functions in a data-driven, unbiased fashion. To fill this gap in the metabolic modeling software ecosystem, we implemented BOFdat, a Python package for the definition of a <b>B</b>iomass <b>O</b>bjective <b>F</b>unction from experimental <b>dat</b>a. BOFdat has a modular implementation that divides the BOF definition process into three independent modules defined here as steps: 1) the coefficients for major macromolecules are calculated, 2) coenzymes and inorganic ions are identified and their stoichiometric coefficients estimated, 3) the remaining species-specific metabolic biomass precursors are algorithmically extracted in an unbiased way from experimental data. We used BOFdat to reconstruct the BOF of the <i>Escherichia coli</i> model <i>i</i>ML1515, a gold standard in the field. The BOF generated by BOFdat resulted in the most concordant biomass composition, growth rate, and gene essentiality prediction accuracy when compared to other methods. Installation instructions for BOFdat are available in the documentation and the source code is available on GitHub (<a href="https://github.com/jclachance/BOFdat" target="_blank">https://github.com/jclachance/BOFdat</a>).</p></div
Integrative characterization of the nearâminimal bacterium Mesoplasma florum
Abstract The nearâminimal bacterium Mesoplasma florum is an interesting model for synthetic genomics and systems biology due to its small genome (~ 800 kb), fast growth rate, and lack of pathogenic potential. However, fundamental aspects of its biology remain largely unexplored. Here, we report a broad yet remarkably detailed characterization of M. florum by combining a wide variety of experimental approaches. We investigated several physical and physiological parameters of this bacterium, including cell size, growth kinetics, and biomass composition of the cell. We also performed the first genomeâwide analysis of its transcriptome and proteome, notably revealing a conserved promoter motif, the organization of transcription units, and the transcription and protein expression levels of all proteinâcoding sequences. We converted gene transcription and expression levels into absolute molecular abundances using biomass quantification results, generating an unprecedented view of the M. florum cellular composition and functions. These characterization efforts provide a strong experimental foundation for the development of a genomeâscale model for M. florum and will guide future genome engineering endeavors in this simple organism
Recommended from our members
Genome-scale metabolic modeling reveals key features of a minimal gene set.
Mesoplasma florum, a fast-growing near-minimal organism, is a compelling model to explore rational genome designs. Using sequence and structural homology, the set of metabolic functions its genome encodes was identified, allowing the reconstruction of a metabolic network representing Ë 30% of its protein-coding genes. Growth medium simplification enabled substrate uptake and product secretion rate quantification which, along with experimental biomass composition, were integrated as species-specific constraints to produce the functional iJL208 genome-scale model (GEM) of metabolism. Genome-wide expression and essentiality datasets as well as growth data on various carbohydrates were used to validate and refine iJL208. Discrepancies between model predictions and observations were mechanistically explained using protein structures and network analysis. iJL208 was also used to propose an in silico reduced genome. Comparing this prediction to the minimal cell JCVI-syn3.0 and its parent JCVI-syn1.0 revealed key features of a minimal gene set. iJL208 is a stepping-stone toward model-driven whole-genome engineering
Genomeâscale metabolic modeling reveals key features of a minimal gene set
Mesoplasma florum, a fastâgrowing nearâminimal organism, is a compelling model to explore rational genome designs. Using sequence and structural homology, the set of metabolic functions its genome encodes was identified, allowing the reconstruction of a metabolic network representing ËÂ 30% of its proteinâcoding genes. Growth medium simplification enabled substrate uptake and product secretion rate quantification which, along with experimental biomass composition, were integrated as speciesâspecific constraints to produce the functional iJL208 genomeâscale model (GEM) of metabolism. Genomeâwide expression and essentiality datasets as well as growth data on various carbohydrates were used to validate and refine iJL208. Discrepancies between model predictions and observations were mechanistically explained using protein structures and network analysis. iJL208 was also used to propose an in silico reduced genome. Comparing this prediction to the minimal cell JCVIâsyn3.0 and its parent JCVIâsyn1.0 revealed key features of a minimal gene set. iJL208 is a steppingâstone toward modelâdriven wholeâgenome engineering