Metabolomic effects of single gene deletions in Saccharomyces cerevisiae

Abstract

Tese de mestrado em Bioquímica, Universidade de Lisboa, Faculdade de Ciências, 2021Saccharomyces cerevisae é um organismo modelo com cerca de 6000 genes. A maior parte destes genes podem ser eliminados sem comprometer a viabilidade da levedura, sendo uma vasta fração destas mutações silenciosas, não produzindo um fenótipo aparente observável. Mudanças fenotípicas associadas a muitas mutações podem apenas ser observadas com o crescimento em certos meios de cultura ou sob determinadas condições de stress. No entanto, variações significativas ocorrem no metabolismo intracelular das células mutadas, particularmente se estas mutações estiverem associadas a vias metabólicas chave. Os estudos destas variações normalmente envolvem a caracterização de atividades enzimáticas ou a quantificação de um pequeno número de metabolitos para obter uma pequena fração do metabolismo específico de uma estirpe mutante. O desenvolvimento de plataformas analíticas que permitem a análise de perfis de metabolitos em grande escala, particularmente baseadas em espectrometria de massa, tem contribuído para uma caracterização mais completa do metaboloma de um organismo. A utilização de instrumentos de extrema resolução, tais como o espectrómetro de massa de ressonância ciclotrónica de ião com transformada de Fourier (FT-ICR, Fourier-transform ion cyclotron resonance), permite a deteção de milhares a dezenas de milhares de compostos e os mais recentes permitem até resolver a estrutura isotópica fina molecular, sendo particularmente relevantes na análise discriminatória de compostos com base em perfis químicos complexos. Neste trabalho foi seguida uma abordagem de metabolómica global (também denominada untargeted) baseada em FT-ICR-MS para o estudo do impacto de deleções de um só gene em leveduras da espécie Saccharomyces cerevisiae. Para este efeito, cinco estirpes isogénicas desta espécie foram analisadas. Além da estirpe de referência, foram analisadas três estirpes mutantes com deleção de um gene relacionadas com o catabolismo do metilglioxal, um composto dicarbonilo, muito reativo e citotóxico implicado em diversas condições patológicas. Duas destas estirpes mutantes apresentavam deleções nos genes GLO1 e GLO2, que codificam para os dois enzimas do sistema dos glioxalases, respetivamente o glioxalase I e o glioxalase II. Este sistema catalisa a degradação do metilglioxal de uma forma dependente do glutationo. A terceira estirpe relacionada com o catabolismo do metilglioxal, apresentava uma deleção no gene GRE3, que codifica para o enzima aldose redutase da levedura, o principal atuante num processo alternativo de eliminação do metilglioxal que não depende do glutationo. Finalmente, uma outra estirpe, deficiente no gene ENO1, que codifica para o enzima enolase 1, relacionado com a glicólise, foi também analisada como controlo. As estirpes foram crescidas em iguais condições, tendo sido analisado o seu crescimento a 600nm e posteriormente o seu metaboloma por FT-ICR-MS. Não foi observada alteração de fenótipo de crescimento, tendo as cinco estirpes apresentado curvas de crescimento extremamente semelhantes, atingindo todas a fase estacionária de crescimento ao fim de 10 a 12 horas. A extração dos metabolitos de todas as estirpes, em fase estacionária de crescimento, foi efetuada utilizando uma mistura de metanol/água (1:1) e os diferentes extratos foram de seguida analisados por FT-ICR-MS em modo positivo de ionização por electrospray. As listas de picos dos espectros obtidos foram depois alinhadas e utilizadas para a identificação dos metabolitos, utilizando bases de dados metabolómicas humana e de levedura, e para a obtenção das fórmulas de composição elementar, previstas com base numa série de regras heurísticas. Realizaram-se depois contagens do número de metabolitos em cada amostra e em cada estirpe, e contruiu-se um diagrama de Venn com a distribuição dos números de metabolitos comuns e exclusivos para cada estirpe. Analisaram-se ainda as naturezas químicas das moléculas em cada estirpe, para as quais tinha sido possível prever uma fórmula química, construindo-se diagramas de Van Krevelen e um gráfico de séries de composição química. Três métodos de análise estatística multivariada foram aplicados aos dados de metabolómica. Estes foram a análise de componentes principais (PCA – principal component analysis), a análise de agrupamento hierárquico aglomerativo (HCA- hieararchical clustering analysis) e a análise discriminatória por regressão de mínimos quadrados parciais (PLS-DA – partial least squares discriminant analysis). Os primeiros dois são métodos não-supervisionados, o que significa que não é considerada a existência de grupos previamente definidos pelos quais as amostras se distribuem (neste caso as estirpes). Isto permite-lhes fazer uma separação das amostras com base numa medida global de semelhança entre elas, assegurando que os resultados refletem o perfil químico das amostras. Já o terceiro, PLS-DA, é um método supervisionado que pretende maximizar a covariância entre grupos previamente definidos. Isto leva a uma separação que pode não refletir necessariamente as maiores diferenças entre as amostras, visto que é dada uma maior importância a algumas variáveis (metabolitos) de modo a permitir uma melhor separação entre os grupos pré-definidos (estirpe), independentemente de esses grupos corresponderem ou não à melhor forma de separar as amostras. No entanto, o PLS-DA é útil pois permite a identificação das variáveis que mais contribuem para a separação. Neste trabalho, os dois métodos não supervisionados (PCA e HCA) demonstraram que era possível distinguir as estirpes com base nos seus perfis metabólicos, visto que amostras pertencentes à mesma estirpe apresentaram consistentemente um maior grau de semelhança metabólica entre elas do que com amostras pertencentes a estirpes diferentes. Além disso, revelaram-se também a existência de semelhanças entre as duas estirpes mutantes relacionadas com o sistema dos glioxalases (GLO1 e GLO2). A aplicação do método PLS-DA, supervisionado, permitiu maximizar a separação entre as estirpes, o que se revelou extremamente semelhante às separações realizadas pelos dois métodos não supervisionados. Esta concordância indica que a principal causa para as diferenças metabólicas entre as diferentes amostras se relaciona com a diferença de um só gene entre as estirpes, uma vez que a maximização da variância entre todas as amostras produz resultados semelhantes à maximização da covariância entre as estirpes. Através da análise das pontuações de importância da variável na projeção (VIP scores – variable importances on projection scores) calculadas para a separação por PLS-DA, identificaram-se os metabolitos que mais contribuíram para a separação, tendo o glutationo (GSH) emergido como o composto de maior importância, seguido de vários outros que apresentam, na generalidade, uma distribuição de abundâncias relativas semelhante. A asserção da importância do glutationo está em concordância com os níveis de semelhança metabólica verificados pelos métodos de análise estatística não-supervisionados. O glutationo apresenta uma menor abundância relativa nas estirpes com deleções em genes que codificam para os enzimas do sistema dos glioxalases, visto estes enzimas serem essenciais para a regeneração dos níveis desta molécula. Assim sendo, e tendo em consideração a identificação do glutationo como o composto mais importante para a separação por PLS-DA, a qual é extremamente semelhante às separações pelos métodos não supervisionados, é possível teorizar que as semelhanças verificadas entre as estirpes relacionadas com o sistema dos glioxilases são em larga parte devidas ao impacto da diminuição dos níveis de glutationo nas células. Com esta abordagem de metabolómica untargeted baseada em FT-ICR-MS, foi possível distinguir entre cinco estirpes de levedura que diferiam umas das outras em apenas um gene e que não apresentavam quaisquer diferenças fenotípicas observáveis quando crescidas em condições normais.Saccharomyces cerevisiae is a model eukaryote with around 6000 genes. Most of these genes can be deleted without compromising yeast viability, with a vast fraction of these mutations being silent and not producing an apparent observable phenotype. Phenotypic changes associated with many mutations may only be observed in specific growth media or under certain stress conditions. Nevertheless, significant variations occur in the intracellular metabolism of mutated cells, particularly if these mutations are associated with key metabolic pathways. The studies that reveal these variations usually involve the characterization of an enzyme activity or the quantification of a small number of metabolites to obtain “metabolic snapshots” for a specific yeast mutated strain. The development of analytical platforms allowing for the analysis of large metabolite profiles, particularly based on mass spectrometry, has contributed to a more thorough characterization of the organism’s metabolome. The use of extreme resolution instruments, like the Fourier-transform ion cyclotron resonance (FT-ICR) mass spectrometer, allows the detection of thousands to tens of thousands of compounds and the most recent ones are even able to resolve the isotopic fine molecular structure, being particularly relevant in sample discriminatory analysis based on complex chemical profiles. An untargeted metabolomics approach based on FT-ICR-MS was applied to study of the impact of single-gene deletions in the yeast Saccharomyces cerevisiae. For this purpose, five isogenic strains belonging to this species were analysed. Besides the wild-type strain, we chose three null mutants involved in the methylglyoxal catabolism, a well characterized biochemical system in yeast. These mutants lack the genes coding for the main enzymes related with methylglyoxal catabolism, glyoxalase I, glyoxalase II and aldose reductase. Another strain lacking enolase 1 gene, related to glycolysis, was also analysed as control. All strains were grown under the same conditions, without any alteration in growth phenotype being reported. Afterwards, metabolite extraction was performed and the extracts were analysed through FT-ICR-MS. The identified metabolites were putatively annotated with names (using human and yeast metabolomic databases as reference) and with chemical formulas (predicted based on a set of heuristic rules). Three multivariate statistical analysis methods were applied to the MS results. These were principal component analysis (PCA), agglomerative hierarchical clustering analysis (HCA) and partial least squares discriminant analysis (PLS-DA). The two unsupervised methods (PCA and HCA) showed that it was possible to distinguish between the strains based on their metabolic profiles, despite the common genetic background. A higher degree of similarity between samples of the same strain was observed, as expected. Similarities between mutant strains related to the glutathione-dependent pathway of methylglyoxal catabolism were also observed. The PLS-DA method, supervised, performed a separation between the samples that proved very similar to the ones performed by the two unsupervised methods. Through this method, the metabolites that contributed the most to the separation were identified, with glutathione (GSH) emerging as the compound with the greatest importance. Through this approach, it was possible to accurately distinguish between five yeasts strains which differed from other solely in one gene and which did not present any observable phenotypic differences when grown under normal conditions

    Similar works