18 research outputs found

    Analyse des graphes de reactions biochimiques avec une application au réseau metabolique de la cellule de plante

    Get PDF
    Nowadays, systems biology are facing the challenges of analysing the huge amount of biological data and large-scale metabolic networks. Although several methods have been developed in recent years to solve this problem, it is existing hardness in studying these data and interpreting the obtained results comprehensively. This thesis focuses on analysis of structural properties, computation of elementary flux modes and determination of minimal cut sets of the heterotrophic plant cellmetabolic network. In our research, we have collaborated with biologists to reconstructa mid-size metabolic network of this heterotrophic plant cell. This network contains about 90 nodes and 150 edges. First step, we have done the analysis of structural properties by using graph theory measures, with the aim of finding its owned organisation. The central points orhub reactions found in this step do not explain clearly the network structure. The small-world or scale-free attributes have been investigated, but they do not give more useful information. In the second step, one of the promising analysis methods, named elementary flux modes, givesa large number of solutions, around hundreds of thousands of feasible metabolic pathways that is difficult to handle them manually. In the third step, minimal cut sets computation, a dual approach of elementary flux modes, has been used to enumerate all minimal and unique sets of reactions stopping the feasible pathways found in the previous step. The number of minimal cut sets has a decreasing trend in large-scale networks in the case of growing the network size. We have also combined elementary flux modes analysis and minimal cut sets computation to find the relationship among the two sets of results. The findings reveal the importance of minimal cut sets in use of seeking the hierarchical structure of this network through elementary flux modes. We have set up the circumstance that what will be happened if glucose entry is absent. Bi analysis of small minimal cut sets we have been able to found set of reactions which has to be present to produce the different sugars or metabolites of interest in absence of glucose entry. Minimal cut sets of size 2 have been used to identify 8 reactions which play the role of the skeleton/core of our network. In addition to these first results, by using minimal cut sets of size 3, we have pointed out five reactions as the starting point of creating a new branch in creationof feasible pathways. These 13 reactions create a hierarchical classification of elementary flux modes set. It helps us understanding more clearly the production of metabolites of interest inside the plant cell metabolism.Aujourd’hui, la biologie des systèmes est confrontée aux défis de l’analyse de l’énorme quantité de données biologiques et à la taille des réseaux métaboliques pour des analyses à grande échelle. Bien que plusieurs méthodes aient été développées au cours des dernières années pour résoudre ce problème, ce sujet reste un domaine de recherche en plein essor. Cette thèse se concentre sur l’analyse des propriétés structurales, le calcul des modes élémentaires de flux et la détermination d’ensembles de coupe minimales du graphe formé par ces réseaux. Dans notre recherche, nous avons collaboré avec des biologistes pour reconstruire un réseau métabolique de taille moyenne du métabolisme cellulaire de la plante, environ 90 noeuds et 150 arêtes. En premier lieu, nous avons fait l’analyse des propriétés structurelles du réseau dans le but de trouver son organisation. Les réactions points centraux de ce réseau trouvés dans cette étape n’expliquent pas clairement la structure du réseau. Les mesures classiques de propriétés des graphes ne donnent pas plus d’informations utiles. En deuxième lieu, nous avons calculé les modes élémentaires de flux qui permettent de trouver les chemins uniques et minimaux dans un réseau métabolique, cette méthode donne un grand nombre de solutions, autour des centaines de milliers de voies métaboliques possibles qu’il est difficile de gérer manuellement. Enfin, les coupes minimales de graphe, ont été utilisés pour énumérer tous les ensembles minimaux et uniques des réactions qui stoppent les voies possibles trouvées à la précédente étape. Le nombre de coupes minimales a une tendance à ne pas croître exponentiellement avec la taille du réseau a contrario des modes élémentaires de flux. Nous avons combiné l’analyse de ces modes et les ensembles de coupe pour améliorer l’analyse du réseau. Les résultats montrent l’importance d’ensembles de coupe pour la recherche de la structure hiérarchique du réseau à travers modes de flux élémentaires. Nous avons étudié un cas particulier : qu’arrive-t-il si on stoppe l’entrée de glucose ? En utilisant les coupes minimales de taille deux, huit réactions ont toujours été trouvés dans les modes élémentaires qui permettent la production des différents sucres et métabolites d’intérêt au cas où le glucose est arrêté. Ces huit réactions jouent le rôle du squelette / coeur de notre réseau. En élargissant notre analyse aux coupes minimales de taille 3, nous avons identifié cinq réactions comme point de branchement entre différent modes. Ces 13 réactions créent une classification hiérarchique des modes de flux élémentaires fixés et nous ont permis de réduire considérablement le nombre de cas à étudier (approximativement divisé par 10) dans l’analyse des chemins réalisables dans le réseau métabolique. La combinaison de ces deux outils nous a permis d’approcher plus efficacement l’étude de la production des différents métabolites d’intérêt par la cellule de plante hétérotrophique

    Final Report: Efficient Databases for MPC Microdata

    Full text link

    Robust learning to rank models and their biomedical applications

    Get PDF
    There exist many real-world applications such as recommendation systems, document retrieval, and computational biology where the correct ordering of instances is of equal or greater importance than predicting the exact value of some discrete or continuous outcome. Learning-to-Rank (LTR) refers to a group of algorithms that apply machine learning techniques to tackle these ranking problems. Despite their empirical success, most existing LTR models are not built to be robust to errors in labeling or annotation, distributional data shift, or adversarial data perturbations. To fill this gap, we develop four LTR frameworks that are robust to various types of perturbations. First, Pairwise Elastic Net Regression Ranking (PENRR) is an elastic-net-based regression method for drug sensitivity prediction. PENRR infers robust predictors of drug responses from patient genomic information. The special design of this model (comparing each drug with other drugs in the same cell line and comparing that drug with itself in other cell lines) significantly enhances the accuracy of the drug prediction model under limited data. This approach is also able to solve the problem of fitting on the insensitive drugs that is commonly encountered in regression-based models. Second, Regression-based Ranking by Pairwise Cluster Comparisons (RRPCC) is a ridge-regression-based method for ranking clusters of similar protein complex conformations generated by an underlying docking program (i.e., ClusPro). Rather than using regression to predict scores, which would equally penalize deviations for either low-quality and high-quality clusters, we seek to predict the difference of scores for any pair of clusters corresponding to the same complex. RRPCC combines these pairwise assessments to form a ranked list of clusters, from higher to lower quality. We apply RRPCC to clusters produced by the automated docking server ClusPro and, depending on the training/validation strategy, we show. improvement by 24%–100% in ranking acceptable or better quality clusters first, and by 15%–100% in ranking medium or better quality clusters first. Third, Distributionally Robust Multi-Output Regression Ranking (DRMRR) is a listwise LTR model that induces robustness into LTR problems using the Distributionally Robust Optimization framework. Contrasting to existing methods, the scoring function of DRMRR was designed as a multivariate mapping from a feature vector to a vector of deviation scores, which captures local context information and cross-document interactions. DRMRR employs ranking metrics (i.e., NDCG) in its output. Particularly, we used the notion of position deviation to define a vector of relevance score instead of a scalar one. We then adopted the DRO framework to minimize a worst-case expected multi-output loss function over a probabilistic ambiguity set that is defined by the Wasserstein metric. We also presented an equivalent convex reformulation of the DRO problem, which is shown to be tighter than the ones proposed by the previous studies. Fourth, Inversion Transformer-based Neural Ranking (ITNR) is a Transformer-based model to predict drug responses using RNAseq gene expression profiles, drug descriptors, and drug fingerprints. It utilizes a Context-Aware-Transformer architecture as its scoring function that ensures the modeling of inter-item dependencies. We also introduced a new loss function using the concept of Inversion and approximate permutation matrices. The accuracy and robustness of these LTR models are verified through three medical applications, namely cluster ranking in protein-protein docking, medical document retrieval, and drug response prediction

    Seventh Biennial Report : June 2003 - March 2005

    No full text

    Sixth Biennial Report : August 2001 - May 2003

    No full text

    Genetics and Genomics of Forest Trees

    Get PDF
    Forest tree genetics and genomics are advancing at an accelerated rate, thanks to recent developments in high-throughput, next-generation sequencing capabilities, and novel biostatistical tools. Population and landscape genetics and genomics have seen the rise of new approaches implemented in large-scale studies that employ the use of genome-wide sampling. Such studies have started to discern the dynamics of neutral and adaptive variation in nature and the processes that underlie spatially explicit patterns of genetic and genomic variation in nature. The continuous development of genetic maps in forest trees and the expansion of QTL and association mapping approaches contribute to the unravelling of the genotype-phenotype relationship and lead to marker-assisted and genome-wide selection. However, major challenges lie ahead. Recent literature suggests that species demography and genetic diversity have been affected both by climatic oscillations and anthropogenically induced stresses in a way calls into question the possibility of future adaptation. Moreover, the pace of contemporary environmental change presents a great challenge to forest tree populations and their ability to adapt, taking into consideration their life history characteristics. Several questions emerge that include, but are not limited to, the interpretation of forest tree genome surveillance and their structural/functional properties, the adaptive and neutral processes that have shaped forest tree genomes, the analysis of phenotypic traits relevant to adaptation (especially adaptation under contemporary climate change), the link between epigenetics/epigenomics and phenotype/genotype, and the use of genetics/genomics as well as genetic monitoring to advance conservation priorities

    LIPIcs, Volume 244, ESA 2022, Complete Volume

    Get PDF
    LIPIcs, Volume 244, ESA 2022, Complete Volum

    Untying Gordian knots: The evolution and biogeography of the large European apomictic polyploid Ranunculus auricomus plant complex

    Get PDF
    Polyploidie, das Vorhandensein von zwei oder mehr vollständigen Chromosomensätzen, tritt wiederholt über den gesamten Baum des Lebens auf. Bei Pflanzen ist die wirtschaftliche, aber vor allem auch die evolutionäre Bedeutung überwältigend. Polyploidisierungen, wahrscheinlich verbunden mit Schlüsselinnovationen (z.B. die Entwicklung der Gefäßelemente oder des Fruchtblattes), traten in der Evolution der Blütenpflanzen häufig auf. Blütenpflanzen sind die artenreichste Gruppe im Pflanzenreich mit ca. 370,000 Arten und umfassen 30–70% Neopolyploide. Es wird angenommen, dass Polyploidie und Hybridisierung (Allopolyploidie) besonders zur Entstehung von Biotypen mit neuartiger genomischer Zusammensetzung beitragen und damit Schlüsselfaktoren für nachfolgende Artbildungen und Makroevolution sind. Bei Pflanzen sind beide Prozesse häufig mit Apomixis, der Reproduktion über asexuell gebildete Samen, verbunden. Das rätselhafte Phänomen der von Polyploidie und Apomixis begleiteten Artbildung ist jedoch trotz enormer Fortschritte auf dem Gebiet der Genomik noch immer kaum verstanden. Die Frage „Was ist eine Art?“ hat für Evolutionsbiologen höchste Priorität: Arten sind die Grundlage der Biodiversitätsforschung, und die evolutionäre und ökologische Forschung stützt sich auf gut definierte Einheiten. Evolutionär junge Artkomplexe bieten eine einzigartige Möglichkeit die Artbildung bei Pflanzen und deren begleitende Prozesse zu erforschen und zu verstehen. Sie umfassen meist wenige sexuelle Stammarten und zahlreiche polyploide, teilweise apomiktische, hybridogene Derivate. Das Fehlen von Rekombination und Kreuzbestäubung in apomiktischen Linien kann zu einer Vielzahl klonaler Hybridlinien mit fixierten morphologischen und ökologischen Merkmalen führen (Agamospezies). Selbst das Erkennen und Abgrenzen der sexuellen Stammarten ist aufgrund geringer genetischer Divergenz, eventuellen hybridogenen Ursprüngen, stetigem Genfluss und/oder unvollständiger genetischer Auftrennung der Abstammungslinien (ILS) methodisch herausfordernd. Integrative Ansätze, die sowohl genomische als auch morphometrische Daten verwenden, um die jungen Stammarten aufzutrennen, fehlen bisher. Die Biogeographie und Evolution der Artkomplexe ist weitaus komplexer. Apomikten besetzen im Vergleich zu ihren sexuellen Verwandten häufig größere Areale oder sind in nördlicheren Regionen verbreitet, ein Phänomen, das als Geographische Parthenogenese (GP) bezeichnet wird. GP-Muster haben meist einen pleistozänen Kontext. Klimatische Schwankungen in den gemäßigten und borealen Zonen boten häufig Möglichkeiten zur interspezifischen Hybridisierung, was wahrscheinlich auch zur Entstehung von Apomixis auf der Nordhalbkugel geführt hat. Faktoren, die diese Muster erzeugen, werden immer noch kontrovers diskutiert. GP-Muster wurden bisher oft den Vorteilen apomiktischer Populationen aufgrund von (Allo)polyploidie und uniparentaler Fortpflanzung zugeschrieben: Fixierte, hohe Heterozygotie führt zu einer erhöhten Stresstoleranz, und Selbstfertilität bedingt eine bessere Kolonisierungsfähigkeit. Einerseits sind die komplexen Wechselwirkungen von genomweiter Heterozygotie, Ploidie, Reproduktionssmodi (sexuell versus asexuell) und klimatischer Umweltfaktoren auf GP-Muster nicht ausreichend untersucht worden, andererseits wurden potentielle Nachteile sexueller Stammarten aufgrund ihres Fortpflanzungssystems auf Fitness und genetische Vielfalt bisher kaum betrachtet. Schließlich sind neben der Biogeographie die retikulate Evolution und die genomische Zusammensetzung und Evolution junger, großer polyploider Pflanzenartenkomplexe noch nicht detailliert entschlüsselt worden. Neben Herausforderungen, die auf eine hohe Anzahl an Polyploidisierungs- und Hybridisierungsereignissen zurückzuführen sind, werden bioinformatische Analysen oft durch fehlende Informationen zu sexuellen Stammarten, Ploidiegraden und Reproduktionsmodi erschwert. Der europäische, polyploid-apomiktische Ranunculus auricomus (Gold-Hahnenfuß) Pflanzenkomplex ist gut geeignet, um alle aufgeworfenen Fragestellungen zu untersuchen. Der Komplex entstand wahrscheinlich durch unzählige Hybridisierungen weniger sexueller Stammarten. Bisher wurden mehr als 800 morphologisch sehr diverse Agamospezies (Derivate) beschriebenen. Die sexuellen Stammarten werden weniger als 1.0 Millionen Jahren alt geschätzt, und die Agamospezies sind wahrscheinlich noch viel jünger. In meiner Dissertation habe ich unter Verwendung des R. auricomus Komplexes als Modellsystem die bisher wenig verstandenen phylogenetischen, genomischen und biogeographischen Beziehungen junger, polyploider Pflanzengruppen untersucht. Ich habe einen umfassenden theoretischen und bioinformatischen Workflow entwicklelt, beginnend mit der Untersuchung der Evolution der sexuellen Stammarten, über die Entschlüsselung der Reproduktionsmodi und Biogeographie polyploid-apomiktischer Derivate bis hin zur Aufdeckung der retikulaten Ursprünge und Genomzusammensetzung und -evolution des Polyploidkomplexes. Diese Arbeit umfasst 251 Populationen und 87 R. auricomus Taxa europaweit. Die Analysen basieren auf 97,312 genomischen Loci (RADseq), 663 Kerngenen (target enrichment) und 71 Plastidenregionen, und 1,474 Blattploidie-, 4,669 Reproduktions- Samen-, 284 Kreuzungs- (Samenansatz), und 1,593 Morphometrie-Messungen. Phylogenomische Daten basierend auf RADseq, Kerngenen und geometrischer Morphometrie unterstützten die Zusammenlegung der zwölf sexuellen Morphospezies in fünf neu klassifizierte Stammarten. Diese Arten stellen klar unterscheidbare genetische Hauptlinien oder Cluster dar, die sowohl geographisch gut isoliert als auch morphologisch klar differenziert sind: R. cassubicifolius s.l., R. envalirensis s.l., R. flabellifolius, R. marsicus und R. notabilis s.l. Enorme retikulate Beziehungen innerhalb der Kladen, die nicht-vorhandene geographische Isolation und das Fehlen markanter morphologischer Merkmale haben zu diesem taxonomischen Konzept geführt. Allopatrische Artbildungsereignisse fanden interessanterweise vor ca. 0.83–0.58 Millionen Jahren während enormer klimatischer Schwankungen statt und wurden wahrscheinlich durch Vikarianzprozesse aus einer weit verbreiteten europäischen Stammart ausgelöst. Darüber hinaus wurde die neue Umschreibung der sexuellen Stammarten durch Populationskreuzungsexperimente unterstützt. Kreuzungen zeigten neben Inzuchtdepression, Auszuchtvorteilen und plötzlicher Selbstkompatibilität auch völlig fehlende Reproduktionsbarrieren zwischen einigen Morphospezies. Darüber hinaus wurden durchflusszytometrische Ploidy- und Reproduktions-, genomweite RADseq- und klimatische Umweltdaten in einer genetisch-informierten Pfadanalyse basierend auf Generalisierten Linearen Gemischten Modellen (GLMMs) kombiniert. Die Analyse hat ein komplexes europäisches GP-Szenario aufgedeckt, in der Diploide im Vergleich zu Polyploiden eine signifikant höhere Sexualität (Prozent sexueller Samen), mehr Blütenblätter (petaloide Nektarblätter) und bis zu dreimal weniger genomweite Heterozygotie zeigten. Die Sexualität war überaschenderweise positiv mit Sonneneinstrahlung und Isothermalität verbunden, und die Heterozygotie zeigte einen positiven Zusammenhang mit der Temperatursaisonalität. Die Ergebnisse stimmen mit der südlichen Verbreitung diploid-sexueller Populationen überein und deuten auf eine höhere Resistenz polyploid-apomiktischer Populationen gegenüber extremeren klimatischen Bedingungen hin. Ein neu entwickelter, multidisziplinärer Workflow, der alle bisherigen Daten einbezieht, deckte zum ersten Mal den weitestgehend allopolyploiden Ursprung und die Genomzusammensetzung und -evolution des R. auricomus Komplexes auf. Die Taxa waren in nur drei bis fünf unterstützten, nord-süd verbreiteten Kladen oder Clustern organisiert, die jeweils meistens diploid-sexuelle Stammarten enthielten. Allopolyploidisierungsereignisse bezogen jeweils zwei bis drei verschiedene, diploid-sexuelle Subgenome ein. Es wurde nur ein autotetraploides Ereignis nachgewiesen. Allotetraploide Genome sind gekennzeichnet durch Subgenomdominanz und einer enormen Evolution nach ihrer Entstehung (z.B. Mendelsche Segregation der Hybridgenerationen, Rückkreuzungen zu Elternarten und Genfluss aufgrund fakultativer Sexualität der Apomikten). Die über 800 Taxa des europäischen R. auricomus-Komplexes sind vermutlich aus vier diploiden Stammarten und eine bisher unbekannte, aktuell wahrscheinlich ausgestorbene Stammart, entstanden. Analysen zeigten auch, dass die Mehrzahl der beschriebenen polyploiden Agamospezies nicht monophyletisch ist und ähnliche Morphotypen wahrscheinlich mehrfach entstanden sind. Eine umfassende taxonomische Überarbeitung des gesamten Komplexes ist daher angebracht. In der Allgemeinen Diskussion kombiniere ich die Ergebnisse meiner Dissertation mit bereits existierenden Pflanzenstudien zur diploid-sexuellen und polyploid-apomiktischen Phylogenetik, Biogeographie und Genomzusammensetzung und -evolution junger Artkomplexe. Ich gebe zudem taxonomische Schlussfolgerungen und erkläre wie Artkomplexe mikro- und makroevolutionäre Prozesse miteinander verbinden. Abschließend gebe ich ein Fazit über die Ergebnisse meiner Dissertation und einen Ausblick für das laufende Forschungsprojekt und der Forschungsdisziplin der polyploiden Phylogenetik.Polyploidy, the presence of two or more full genomic complements, repeatedly occurs across the tree of life. In plants, not only the economic but particularly the evolutionary importance is overwhelming. Polyploidization events, probably connected to key innovations (e.g., vessel elements or the carpel), occurred frequently in the evolutionary history of flowering plants, which are the most species-rich group in the plant kingdom (ca. 370,000 species) and contain 30–70% neopolyploids. Polyploidy and hybridization (i.e., allopolyploidy) are particularly considered to create biotypes with novel genomic compositions and to be key factors for subsequent speciation and macroevolution. In plants, both processes are frequently connected to apomixis, i.e., the reproduction via asexually-formed seeds. However, the enigmatic phenomenon of plant speciation accompanied by polyploidy and apomixis is still poorly understood despite tremendous progress in the field of genomics. The question of “What is a species?” is of highest priority for evolutionary biologists: Species are the fundamental units for biodiversity, and further evolutionary and ecological research relies on well-defined entities. Evolutionarily young plant species complexes offer a unique opportunity to study plant speciation and accompanying processes. They usually comprise a few sexual progenitor species, and numerous polyploid, partly apomictic, hybrid derivatives. In apomictic lineages, the lack of recombination and cross-fertilization can result in numerous clonal lineages with fixed morphological and ecological traits (agamospecies). Nevertheless, even recognizing and delimiting the sexual progenitors of species complexes is methodically challenging due to low genetic divergence, possible hybrid origins, ongoing gene flow, and/or incomplete lineage sorting (ILS). Integrative approaches using both genomic and morphometric data for disentangling the young progenitors are still lacking so far. The biogeography and evolution of those plant complexes is even more challenging. Apomicts frequently occupy larger areas or more northern regions compared to their sexual relatives, a phenomenon called geographical parthenogenesis (GP). GP patterns usually have a Pleistocene context because climatic range shifts in temperate to boreal zones offered frequent opportunities for interspecific hybridization, probably giving rise to apomixis in the Northern Hemisphere. Factors shaping GP patterns are still controversially discussed. GP has been widely attributed to advantages of apomicts caused by polyploidy and uniparental reproduction, i.e., fixed levels of high heterozygosity leading to increased stress tolerance, and self-fertility leading to better colonizing capabilities. On the one hand, complex interactions of genome-wide heterozygosity, ploidy, reproduction mode (sexual versus asexual), and climatic environmental factors shaping GP have not been studied enough. On the other hand, potential disadvantages of sexual progenitors due to their breeding system on fitness and genetic diversity have received even less attention. Finally, alongside biogeography, the reticulate relationships and genome composition and evolution of young, large polyploid plant species complexes have not yet been deciphered comprehensively. Besides challenges attributed to numerous numbers of polyploidization and hybridization events, bioinformatic analyses are also often hampered by missing information on progenitors, ploidy levels, and reproduction modes. The European apomictic polyploid Ranunculus auricomus (goldilock buttercup) plant complex is well-suited to study all the aforementioned issues. The majority of goldilock buttercups probably arose from hybridization of a few sexual progenitors, leading to more than 800 described, morphologically highly diverse agamospecies. Sexuals are estimated to have speciated less than 1.0 million years ago, and agamospecies are probably much younger. In this thesis, using R. auricomus as a model system, I examined the recalcitrant and hitherto poorly understood phylogenetic, genomic, and biogeographical relationships of young polyploid apomictic plant complexes. I developed a comprehensive theoretical and bioinformatic workflow, starting with analyzing the evolution of the sexual progenitor species, continuing with unraveling reproduction modes and biogeography of apomictic polyploids, and ending up with revealing the reticulate origins and genome composition and evolution of the polyploid complex. Spanning up to 251 populations and 87 R. auricomus taxa Europe-wide, this work gathered data of 97,312 genomic loci (RADseq), 663 nuclear genes (target enrichment), and 71 plastid regions, and 1,474 leaf ploidy, 4,669 reproductive seed, 284 reproductive crossing (seed sets), as well as 1,593 geometric morphometric measurements. First of all, phylogenomics based on RADseq, nuclear gene, and geometric morphometric data supported the lumping of the twelve described sexual morphospecies into five newly circumscribed progenitor species. These species represent clearly distinguishable genetic main lineages or clusters, which are both well geographically isolated and morphologically differentiated: R. cassubicifolius s.l., R. envalirensis s.l., R. flabellifolius, R. marsicus, and R. notabilis s.l. Mainly within-clade reticulate relationships, missing geographical isolation, and a lack of distinctive morphological characters led to this taxonomic treatment. Interestingly, allopatric speciation events took place ca. 0.83–0.58 million years ago during a period of severe climatic oscillations, and were probably triggered by vicariance processes of a widespread European forest-understory ancestor. Sexual species re-circumscriptions were additionally supported by population crossing experiments. Besides inbreeding depression, outbreeding benefits, and sudden self-compatibility, crossings also revealed a lack of reproductive barriers among some of the formerly described morphospecies. Moreover, flow cytometric ploidy and reproductive, RADseq, and environmental data were combined into a genetically informed path analysis based on Generalized Linear Mixed Models (GLMMs). The analysis unveiled a complex European GP scenario, whereby diploids compared to polyploids showed significantly higher sexuality (percent of sexual seeds), more petals (petaloid nectary leaves), and up to three times less genome-wide heterozygosity. Surprisingly, sexuality was positively associated with solar radiation and isothermality, and heterozygosity was positively related to temperature seasonality. Results fit the southern distribution of diploid sexuals and suggest a higher resistance of polyploid apomicts to more extreme climatic conditions. Finally, a self-developed, multidisciplinary workflow incorporating all previously gathered data demonstrated, for the first time, the predominantly allopolyploid origin, genome composition, and post-origin genome evolution of the R. auricomus complex. Taxa were organized in only three to five supported, north-south distributed clades or cluster, each usually containing diploid sexual progenitor species. Allopolyploidizations involved two to three different diploid sexual subgenomes per event. Only one autotetraploid event was detected. Allotetraploids were characterized by subgenome dominance and enormous post-origin evolution, i.e., Mendelian segregation of hybrid generations, back-crossing to parents, and/or gene flow due to facultative sexuality of apomicts. Four diploid sexual progenitors and a previously unknown, nowadays extinct progenitor, probably gave rise to the more than 800 taxa of the European R. auricomus complex. Analyses also showed that the majority of analyzed polyploid agamospecies are non-monophyletic and similar morphotypes probably originated multiple times. The lack of monophyly suggests a comprehensive taxonomic revision of the entire complex. In the General Discussion, I combine my thesis results with existing plant studies on diploid sexual and polyploid apomictic phylogenetics, biogeography, and composition and genome evolution of young species complexes. I explain the taxonomic conclusions and how species complexes link micro- and macroevolutionary processes. Finally, I give conclusions of my thesis and an outlook of the project and the field of polyploid phylogenetics.2021-10-2

    LIPIcs, Volume 274, ESA 2023, Complete Volume

    Get PDF
    LIPIcs, Volume 274, ESA 2023, Complete Volum
    corecore