Reconstruction of the genome-scale metabolic network of Kluyveromyces lactis

Dias, Oscar

thesis

Reconstruction of the genome-scale metabolic network of Kluyveromyces lactis

Authors: Oscar Dias
Publication date: 25 June 2013
Publisher

Abstract

System Biology proposes to study biological components, as well as the interactions between them, to understand and predict systems’ behaviour through the use of mathematical models. Under this scope, Genome-Scale Metabolic Models (GSMMs) can be regarded as mathematical representations of the intrinsic metabolic capabilities of a given organism, encoded in its genome, and can be used in a variety of applications like predicting the phenotypical behaviour of a given organism in different environmental and genetic perturbations. The reconstruction of these models comprehends four fundamental stages, namely Genome Annotation, Assembling of a Metabolic Network from the Genome, the Conversion of the Network to a Stoichiometric Model and finally the Validation of the Metabolic Model. Although this procedure is currently relatively standardized in some stages, a significant amount of work still needs to be done by the community before the reconstruction process becomes semi-automated and reproducible. The present work aims at contributing to this field through the development of several tools for aiding the reconstruction process, while simultaneously applying some of those tools to an industrially relevant organism, the yeast Kluyveromyces lactis. The genome annotation stage is critical, as an inadequate annotation may delay, or even impair, the development of the model. The genome metabolic annotation consists on identifying and attributing functions to metabolic genes, i.e., genes encoding enzymes and transport proteins. While the identification of enzyme encoding genes can be performed by assigning Enzyme Commission numbers to the proteins encoded in the genes, the transport proteins encoding genes annotation is not straightforward. In this work, an automatic system to detect and classify all potential transport proteins from a given genome and integrate the related reactions into GSMMs is proposed, based on the identification and classification of genes that encode transmembrane proteins. The integration of the data provided by this methodology with highly curated models allowed the identification of new transport reactions. This tool was included in the merlin tool, a user-friendly Java application developed under the scope of this thesis that performs the reconstruction of GSMMs for any organism that has its genome sequenced. It performs several steps of the reconstruction process, including the functional genomic annotation of the whole genome. merlin 2.0 also performs the compartmentalisation of the model, predicting the organelle localisation of the proteins encoded in the genome, and thus the localisation of the metabolites involved in the reactions induced by such proteins. Finally, merlin 2.0 expedites the transition from genome-scale data to SBML (the standard Systems Biology Markup Language) metabolic models, allowing the user to have a preliminary view of the biochemical network. The yeast Kluyveromyces lactis has long been considered a model organism for studies in genetics and physiology, mainly due to its ability to metabolize lactose and to express recombinant proteins. Although the genome of Kluyveromyces lactis has been publicly available for some years, until now no complete metabolic functional annotation has been performed to the proteins encoded in the Kluyveromyces lactis genome and consequently no GSMM has been made available. In this work, a new metabolic genome-wide functional re-annotation of the proteins encoded in the Kluyveromyces lactis genome was performed, resulting in the annotation of 1759 genes with metabolic functions, and the development of a methodology supported by merlin. The new annotation includes novelties, such as the assignment of transporter superfamily numbers to genes identified as transporter proteins. The methodology developed throughout this work can be used to re-annotate any yeast or, with a little tweak of the reference organism, the proteins encoded in any sequenced genome. The new annotation provided by this study served as the basis for the reconstruction of a compartmentalized, genome-scale metabolic model for Kluyveromyces lactis. The partially compartmentalised (4 compartments) genome-scale metabolic model of Kluyveromyces lactis, the iOD962 metabolic model, comprises 962 genes, 2038 reactions and 1561 metabolites. Previous chemostat experiments were used to adjust both growth and non-growth associated energy requirements, and the model proved accurate when predicting the biomass, oxygen and carbon dioxide yields. Also, the in silico knockouts predicted accurately the in vivo phenotypes, when compared to published experiments. This model allowed determining a minimal medium for cultivating Kluyveromyces lactis and will surely bring new insights on the milk yeast metabolism, identifying engineering targets for the improvement of the yields of products of interest by performing in silico simulations.A Biologia de Sistemas propõe-se estudar os componentes biológicos e as interações entre eles, para compreender e prever o comportamento dos sistemas através do uso de modelos matemáticos. Nesse âmbito, os Modelos Metabólicos à Escala Genómica (MMEGs) podem ser considerados representações matemáticas das capacidades metabólicas intrínsecas de um dado organismo, codificadas no seu genoma, e podem ser usados numa grande variedade de aplicações tais como a previsão do comportamento fenotípico de um determinado organismo face a diferentes perturbações ambientais e genéticas. O processo de reconstrução destes modelos compreende quatro fases fundamentais: anotação do genoma, desenvolvimento da rede metabólica, conversão da rede num modelo estequiométrico e, finalmente, a validação do modelo metabólico. Apesar de algumas destas fases estarem já relativamente normalizadas, existe ainda uma lacuna significativa na comunidade no que se refere à (semi-) automação e reprodutibilidade deste processo. O presente trabalho apresenta-se como uma contribuição para esta área, através do desenvolvimento de várias ferramentas de apoio à construção de modelos metabólicos e, simultaneamente da sua aplicação ao organismo Kluyveromyces lactis, uma levedura de elevado interesse industrial. A fase de anotação do genoma é uma fase crítica, pois uma anotação inadequada pode atrasar, ou mesmo comprometer o desenvolvimento de um modelo metabólico. A anotação metabólica do genoma consiste na identificação e atribuição de funções aos genes metabólicos, ou seja, genes que codificam enzimas e proteínas de transporte. Enquanto que a identificação de enzimas codificadas nos genes pode ser realizada através da atribuição de números da Comissão para as Enzimas, a anotação de genes que codificam as proteínas de transporte é um processo mais complexo. Neste trabalho é proposto um sistema automático para a deteção e classificação de proteínas de transporte. Este sistema é baseado na identificação e classificação dos genes que codificam proteínas transmembranares. A integração dos dados fornecidos por esta metodologia com modelos metabólicos curados permitiu a identificação de novas reações de transporte em organismos bem estudados. Esta ferramenta está incluída na ferramenta bioinformática merlin desenvolvida no âmbito desta tese, que é uma aplicação Java de fácil utilização, direcionada para a reconstrução de modelos metabólicos à escala genómica. Esta aplicação executa várias etapas do processo de reconstrução, incluindo a anotação funcional do genoma. O merlin 2.0 também efetua a compartimentação do modelo, prevendo a localização das proteínas codificadas no genoma, e consequentemente dos metabolitos envolvidos nas reações induzidas por essas proteínas. Finalmente, merlin 2.0 acelera a transição de dados do genoma para modelos metabólicos no formato SBML (Systems Biology Markup Language), possibilitando uma visão preliminar da rede bioquímica. A levedura Kluyveromyces lactis tem sido considerada um organismo modelo para estudos de genética e fisiologia, principalmente devido à sua capacidade de metabolizar a lactose e pela sua capacidade de expressar proteínas recombinantes. Apesar de o genoma da Kluyveromyces lactis ter sido disponibilizado publicamente há alguns anos, até agora não foi efetuada uma anotação funcional completa para identificar as proteínas codificadas no genoma da Kluyveromyces lactis. Consequentemente, não existe ainda nenhum MMEG para esta levedura. Neste trabalho foi efetuada uma re-anotação funcional das proteínas codificadas no genoma da Kluyveromyces lactis, resultando na anotação de 1759 genes com funções metabólicas, e no desenvolvimento de uma metodologia apoiada na aplicação merlin. A nova anotação do genoma inclui novidades, tais como a atribuição de números de superfamílias de transportadores a genes que codificam proteínas de transporte. A metodologia desenvolvida ao longo deste trabalho pode ser usada para reanotar qualquer levedura ou, com um ajuste do organismo de referência, as proteínas codificadas em qualquer genoma sequenciado. A nova anotação fornecida por este estudo serviu de base para a reconstrução de um modelo metabólico à escala genómica da Kluyveromyces lactis. Este modelo metabólico, parcialmente compartimentado (4 compartimentos), designado iOD962, inclui 962 genes, 2038 reações e 1561 metabolitos. Foram utilizadas experiências em quimiostato publicadas anteriormente para ajustar os requisitos energéticos associados à manutenção celular, e o modelo mostrou precisão na previsão dos rendimentos de biomassa, de dióxido de carbono e de oxigénio. Além disso, as simulações in silico previram com precisão os fenótipos in vivo, quando comparadas com as experiências publicadas. Este modelo permitiu determinar um meio mínimo para o cultivo de Kluyveromyces lactis e certamente trará novas perspectivas sobre o metabolismo desta levedura, identificando alvos de engenharia metabólica para a melhoria dos rendimentos dos produtos de interesse através da realização de simulações in silico

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

Universidade do Minho: RepositoriUM

oai:repositorium.sdum.uminho.p...

Last time updated on 12/11/2016