thesis master thesis
Integrated analysis of the genetic and tuber phenotypic diversity in cubio (Tropaeolum tuberosum, Tropaeolaceae) morphotypes from Colombia and Bolivia
Abstract
Tropaeolum tuberosum Ruiz & Pavón, commonly known as cubio, mashua, or isaño, is an Andean tuber with notable agroecological properties, including tolerance to low temperatures, adaptability to nutrient-poor soils, high productivity, and pest resistance. It is also valued for its nutritional and bioactive compounds. Despite these attributes, cubio remains an underutilized orphan crop with limited economic significance. Previous studies have reported high morphological diversity in tubers and moderate-to-high genetic variation in Peruvian and Colombian populations. The relationship between morphological and genetic diversity has also been explored, yet the findings remain inconclusive. On the one hand, a clear correspondence between the clustering of accessions by morphological tuber traits and genetic structure has been demonstrated, while others report no correlation between them. In fact, some authors point out that morphological diversity is greater than genetic diversity, suggesting that mechanisms other than genetic variation, such as phenotypic plasticity, may account for the morphological variation in cubio. Given this, this study aimed to address the genotype–phenotype relationship in cubio through an integrated framework that assessed genetic variability using whole-genome data and evaluated phenotypic variability from two complementary dimensions: morphological traits and transcriptomic profiles. For this purpose, a high-quality, functionally annotated draft genome (~700 Mbp; 6,200 contigs; N50 = 318,118; BUSCO (eudicots) = 98.37%) was generated, providing the first reference for the species and enabling downstream SNP-based genotyping and differential expression analyses. Characterization of morphological diversity based on qualitative tuber traits in fourteen cubio morphotypes from Colombia and Bolivia revealed medium to high diversity (Gini-Simpson index = 0.26–0.77), with color-related tuber traits being the most discriminative. Whole-genome genotyping identified a core set of 4,599,212 biallelic SNPs across the fourteen individuals, revealing intermediate genetic diversity (He = 0.35) and a genetic structure associated with geographic origin, with low but significant population differentiation between the Colombian and Bolivian datasets (FST = 0.05; ΦST = 0.192, p = 0.0099). No correlation was observed between genetic and morphological variation. Among the core dataset that determined the genetic structure, 1,343 SNPs were classified as high-impact variants, affecting 1,756 genes. GO and KEGG term over-representation analyses of these genes revealed enrichment in primary metabolism, including essential amino acid and ascorbate metabolism. Secondary metabolism pathways were also enriched, including sesquiterpenoid and triterpenoid biosynthesis, cutin, suberin, and wax biosynthesis, lipoic acid metabolism, isoquinoline alkaloid biosynthesis, and zeatin biosynthesis, suggesting potential adaptation to local agroecological conditions. Subsequently, pairwise differential expression analysis of tuber transcriptomic profiles from three solid-color representative cubio morphotypes (purple, white, and yellow) revealed clear morphotype-specific patterns in both pigment-related and non-pigment metabolic pathways. Flavonoid biosynthetic genes were strongly upregulated in the purple morphotype, whereas carotenoid-related genes did not follow a clear morphotype-specific trend, suggesting that their accumulation may depend on metabolic flux and storage rather than transcription alone. The yellow and purple morphotypes showed increased expression of genes in the glucosinolate biosynthesis pathway, in contrast to the white morphotype, which may help explain the white morphotype’s greater commercial popularity. In the shikimate pathway, phenylalanine and tyrosine biosynthesis genes were more highly expressed in the yellow and purple morphotypes, while tryptophan biosynthesis genes were more active in the yellow and white morphotypes. Finally, ascorbate-related genes exhibited the highest expression in the yellow morphotype, followed by purple and white. Overall, cubio tuber traits are shaped by the combined effects of genetic variation, gene expression regulation and environmental factors. While qualitative morphological descriptors alone did not fully capture genotype–phenotype relationships, integrating genomic, morphological, and transcriptomic data provided valuable insights into pigmentation, metabolism, and nutritional potential. Thus, this study established a comprehensive framework, supported by genomic resources, for understanding cubio phenotypic diversity and laid the foundation for future conservation, breeding, and the revalorization of this underutilized crop’s agroecological, nutritional, and medicinal potential.Tropaeolum tuberosum Ruiz & Pavón, comúnmente conocido como cubio, mashua o isaño, es un tubérculo andino con destacadas propiedades agroecológicas de interés, que incluyen tolerancia a bajas temperaturas, adaptabilidad a suelos pobres en nutrientes, alta productividad y resistencia a plagas y patógenos. Es también reconocido por su alto contenido nutricional en conjunto con un arsenal de compuestos bioactivos presentes en el tubérculo. A pesar de sus beneficios, es considerado un cultivo huérfano de escaza importancia económica. Estudios previos han reportado una alta diversidad morfológica que reside principalmente en sus tubérculos y una variación genética moderada a alta en poblaciones de Perú y Colombia. La relación entre la diversidad morfológica y genética también ha sido explorada, aunque los hallazgos siguen siendo inconclusos. Por un lado, se ha demostrado una correspondencia clara entre la agrupación de accesiones según rasgos morfológicos del tubérculo y la estructura genética; mientras otros estudios no reportan correlación entre ambos. Algunos autores incluso señalan que la diversidad morfológica es mayor que la diversidad genética, sugiriendo que mecanismos distintos a la variación genética, como la plasticidad fenotípica, podrían explicar la variación morfológica en cubio. Dado lo anterior, el presente estudio tuvo como objetivo bordar la relación genotipo–fenotipo en cubio mediante un enfoque integrado que evaluó la variabilidad genética utilizando datos de genoma completo y analizó la variabilidad fenotípica desde dos dimensiones complementarias: rasgos morfológicos y perfiles transcriptómicos. Para este propósito, se ensambló un primer borrador del genoma del cubio funcionalmente anotado (~700 Mbp; 6,200 contigs; N50 = 318,118; BUSCO (eudicotiledóneas) = 98,37%), el cual permitió el genotipado de SNPs y los análisis de expresión diferencial. La caracterización de la diversidad morfológica, basada en rasgos cualitativos de los tubérculos de catorce morfotipos de cubio de Colombia y Bolivia, reveló una diversidad de media a alta (índice de Gini-Simpson = 0,26–0,77), siendo los rasgos relacionados con el color del tubérculo los más discriminantes. El genotipado mediante secuenciación del genoma completo identificó un total de 4.599.212 SNPs bialélicos en los catorce individuos, revelando una diversidad genética intermedia (He = 0,35) y una estructura genética asociada al origen geográfico, con una diferenciación poblacional baja pero significativa entre los individuos colombianos y bolivianos (FST = 0,05; ΦST = 0,192, p = 0,0099). No se evidenció ninguna correlación entre variación genética y morfológica. Entre el conjunto total de SNPs que determinaron la estructura genética, 1,343 fueron clasificados como variantes de alto impacto, afectando a 1,756 genes. El análisis de sobre-representación de términos GO y KEGG de estos genes reveló enriquecimiento en términos relacionados con el metabolismo primario, incluyendo metabolismo de aminoácidos esenciales y ascorbato. También se enriquecieron términos asociados con vías de metabolismo secundario, como biosíntesis de sesquiterpenoides y triterpenoides, cutina, suberina y ceras, metabolismo del ácido lipóico, biosíntesis de alcaloides isoquinolínicos y de zeatina, lo que sugiere que estas variantes genéticas podrían haber favorecido la adaptación de los morfotipos a sus condiciones agroecológicas locales. Posteriormente, el análisis de expresión diferencial entre los perfiles transcriptómicos de los tubérculos de tres morfotipos de cubio (morado, blanco y amarillo) reveló patrones claros y específicos de cada morfotipo, tanto en rutas metabólicas relacionadas con pigmentos como en otros metabolitos de interés. Los genes biosintéticos de flavonoides mostraron una fuerte regulación positiva en el morfotipo morado, mientras que los genes relacionados con carotenoides no siguieron un patrón específico según el morfotipo. Los morfotipos amarillo y morado mostraron mayor expresión de genes en la vía de biosíntesis de glucosinolatos, a diferencia del morfotipo blanco, lo que podría explicar en parte la mayor popularidad comercial del cubio blanco. En la vía del shikimato, los genes implicados en la biosíntesis de fenilalanina y tirosina se expresaron más en los morfotipos amarillo y púrpura, mientras que los genes de biosíntesis de triptófano mostraron mayor actividad en los morfotipos amarillo y blanco. Finalmente, los genes relacionados con ascorbato exhibieron la expresión más alta en el morfotipo amarillo, seguidos por el morado y el blanco. En general, los rasgos de los tubérculos de cubio están determinados por la combinación de la variación genética, regulación de la expresión génica y factores ambientales. Aunque los descriptores morfológicos cualitativos por sí solos no capturaron completamente las relaciones genotipo-fenotipo, la integración de datos genómicos, morfológicos y transcriptómicos proporcionó valiosos conocimientos sobre pigmentación, metabolismo y potencial nutricional. Así, este estudio estableció un marco integral, respaldado por recursos genómicos, para comprender la diversidad fenotípica de cubio y sentó las bases para futuros esfuerzos de conservación, mejoramiento y revalorización del potencial agroecológico, nutricional y medicinal de este cultivo subutilizado.FontagroPontificia Universidad JaverianaMagíster en Ciencias BiológicasMaestríahttps://orcid.org/0000-0003-1257-704- http://purl.org/coar/version/c_ab4af688f83e57aa
- Tesis/Trabajo de grado - Monografía - Maestría
- http://purl.org/coar/resource_type/c_bdcc
- info:eu-repo/semantics/masterThesis
- Morphological diversity
- Genetic diversity
- De novo genome assembly
- Secondary metabolites
- WGS
- RNA-Seq
- Diversidad morfológica
- Diversidad genética
- Ensamble de novo del genoma
- Metabolitos secundarios
- Mashua
- Isaño
- Cubio
- Maestría en ciencias biológicas - Tesis y disertaciones académicas
- Colombia
- Bolivia
- Boyacá (Colombia)