thesis

Linkage disequilibrium and association mapping in elite germplasm of European maize

Abstract

In der Pflanzengenetik ist die Kopplungsanalyse das Standardwerkzeug um Genloci zu identifizieren, die für quantitative Merkmale kodieren (QTL). Ein alternativer und vielversprechender Ansatz, der in der Humangenetik bereits erfolgreich dazu eingesetzt wurde, um QTL für Mukoviszidose und Alzheimer-Krankheit aufzufinden, ist die Assoziationskartierung. In der vorliegenden Arbeit werden die Anwendbarkeit von Assoziationskartierungsmethoden zum Auffinden von QTL in Maiselitezüchtungsmaterial untersucht sowie für diesen Zweck geeignete biometrische Methoden entwickelt. Ob Assoziationskartierungsansätze auch in Pflanzenzüchtungspopulationen zum Auffinden von QTL eingesetzt werden können, hängt vom Ausmaß des Gametenphasenungleichgewichtes (GPU) in der interessierenden Population ab. Des weiteren wird die Anwendbarkeit von Assoziationskartierungsmethoden von den Kräften beeinflußt, die in der betreffenden Population GPU verursachen und aufrechterhalten. Die Ziele unserer Studien waren (i) die Erfassung des Ausmaßes und der genomweiten Verteilung des GPU zwischen Mikrosatelliten (SSR) Markern, (ii) der Vergleich dieser Ergebnisse mit denjenigen für Amplifizierte-Fragment-Längen-Polymorphismus (AFLP) Markern sowie (iii) die Untersuchung von Kraften, die in Maiselitezüchtungsmaterial GPU verursachen und aufrechterhalten. Unsere Studien basierten sowohl auf experimentellen Daten von europäischen Maiseliteinzuchtlinien als auch auf Computersimulationen. Unsere Ergebnisse legen nahe, dass in europäischem Maiselitezüchtungsmaterial das Ausmaß an GPU sowohl zwischen SSR Markern als auch zwischen AFLP Markern ausreichend ist, um mit Hilfe der Assoziationskartierung genomweit QTL auffinden zu können. Da die Güte von SSR Markern GPU aufzufinden höher ist als diejenige von AFLP Markern, sind in Populationen mit kurzer Rekombinationsgeschichte SSR Marker geeigneter für Assoziationskartierungen als AFLP Marker. In Populationen mit langer Rekombinationsgeschichte, für die kein signifikantes GPU zwischen SSR Markern zu erwarten ist, sind AFLP Marker geeigneter für Assoziationskartierungen, da in diesem Fall ihre mit gleichem finanziellem Aufwand erzeugte höhere Markerdichte genutzt werden kann. Die Ergebnisse unserer experimentellen Untersuchungen und Simulationsstudien deuten darauf hin, dass in Pflanzenzüchtungspopulationen nicht nur physikalische Kopplung eine Ursache für GPU ist, sondern auch Verwandschaft, Populationsstratifizierung, genetische Drift und Selektion. Der Assoziationstest, der bislang in der Pflanzengenetik eingesetzt wurde, ist der ?logistic regression ratio test? (LRRT). Dieser Test korrigiert allerdings nur für GPU, das durch Populationsstratifizierung verursacht wird. Aus diesem Grund wird erwartet, dass der LRRT das alpha-Niveau nicht einhält, wenn er zur Assoziationskartierung in Populationen eingesetzt wird, in denen GPU vorhanden ist, das durch Verwandschaft, genetische Drift oder Selektion verursacht wird. Die Ziele unserer Studie waren (i) den ?quantitative pedigree disequilibrium test? so zu modifizieren, dass er zur Assoziationskartierung in Pflanzenzüchtungspopulationen eingesetzt werden kann und (ii) den neuentwickelten Test (QIPDT) hinsichtlich seiner Güte und Typ I Fehlerrate bei der Detektion von QTL zu untersuchen und mit dem bislang eingesetzten LRRT zu vergleichen. Diese Studie basierte auf Computersimulationen. Wir beobachteten für den QIPDT eine höhere Güte, QTL aufzufinden, als für den LRRT, wenn Daten verwendet wurden, die routinemäßig in Pflanzenzüchtungsprogrammen erhoben wurden. Im Gegensatz zum LRRT hielt der QIPDT stets das alpha-Niveau ein. Diese Ergebnisse belegen, dass der QIPDT zur genomweiten Assoziationskartierung mit Daten, die routinemäßig in Pflanzenzüchtungsprogrammen erhoben werden, geeigneter ist als der LRRT. Epistatische Interaktionen zwischen QTL tragen wesentlich zur genetischen Variation komplexer Merkmale bei. Die Ziele unserer Studie waren (i) Populationen rekombinanter Inzuchtlinien (RIL), die von einem geschachtelten Kreuzungsschema abgeleitet wurden, hinsichtlich ihrer Güte und Rate an falsch Positiven beim Auffinden epistatischer Interaktionen zwischen drei Loci, zu untersuchen und (ii) diese Ergebnisse mit jenen zu vergleichen, die beobachtet werden, wenn RIL von vollständigen oder unvollständigen Kreuzungsdiallelen abgeleitet wurden. Die Computersimulationen dieser Studie basierten auf Haplotypdaten von 26 Maisinzuchtlinien. Sowohl die Güte als auch die Rate an falsch Positiven beim Auffinden von epistatischen Interaktionen zwischen drei Loci waren für 5000 RIL, die von einem geschachtelten Kreuzungsschema abgeleitet wurden, auf einem Niveau, das vielversprechend für deren Detektion ist. Für RIL, die von optimal allozierten distanz-basierten Kreuzungsschemata abgeleitet wurden, wurde eine höhere Güte, epistatische Interaktionen zwischen drei Loci aufzufinden, beobachtet, als für die gleiche Anzahl an RIL, die von einem geschachtelten Kreuzungsschema oder Kreuzungsdiallelen abgeleitet wurden. Unsere Ergebnisse belegen, dass Assoziationskartierungsmethoden, die an die Besonderheiten von Pflanzenzüchtungspopulationen angepasst sind, in diesen erfolgreich zum Auffinden von QTL eingesetzt werden können.Linkage mapping has become a routine tool for the identification of quantitative trait loci (QTL) in plants. An alternative, promising approach is association mapping, which has been successfully applied in human genetics to detect QTL coding for diseases. The objectives of this research were to examine the feasibility of association mapping in elite maize breeding populations and develop for this purpose appropriate biometric methods. The feasibility of association mapping depends on the extent of linkage disequilibrium (LD) as well as on the forces generating and conserving LD in the population under consideration. The objectives of our studies were to (i) examine the extent and genomic distribution of LD between pairs of simple sequence repeat (SSR) marker loci, (ii) compare these results with those obtained with amplified fragment length polymorphism (AFLP) markers, and (iii) investigate the forces generating and conserving LD in plant breeding populations. Our studies were based on experimental data of European elite maize inbreds as well as on computer simulations modeling the breeding history of the European flint heterotic group. The experimental results on European elite maize germplasm suggested that the extent of LD between SSR markers as well as AFLP markers are encouraging for the detection of marker-phenotype associations in genomewide scans. In populations with a short history of recombination, SSRs are advantageous over AFLPs in that they have a higher power to detect LD. In contrast, in populations with a long history of recombination, for which no LD is expected between pairs of SSR markers, AFLP markers should be favored over SSRs because then their higher marker density that is generated with a fixed budget can be used. Furthermore, the results of our experimental and simulation studies indicated that not only physical linkage is a cause of LD in plant breeding populations, but also relatedness, population stratification, genetic drift, and selection. So far, in plant genetics the logistic regression ratio test (LRRT) has been applied as a population-based association mapping approach. However, this test does only correct for LD caused by population stratification. The objectives of the presented study were to (i) adapt the quantitative pedigree disequilibrium test to typical pedigrees of inbred lines produced in plant breeding programs and (ii) compare the newly developed quantitative inbred pedigree disequilibrium test (QIPDT) and the commonly employed LRRT with respect to the power and type I error rate of QTL detection. This study was based on computer simulations modeling the breeding history of the European maize heterotic groups. In QIPDT the power of QTL detection was higher with 75 extended pedigrees than in LRRT with 75 independent inbreds. Furthermore, while the type I error rate of LRRT surpassed the nominal ® level, the QIPDT adhered to it. These results suggested that the QIPDT is superior to the LRRT for genome-wide association mapping if data collected routinely in plant breeding programs are available. Epistatic interactions among QTL contribute substantially to the genetic variation in complex traits. The main objectives of our study were to (i) investigate by computer simulations the power and proportion of false positives for detecting three-way interactions among QTL involved in a metabolic pathway in populations of recombinant inbred lines (RILs) derived from a nested design and (ii) compare these estimates to those obtained for detecting three-way interactions among QTL in RIL populations derived from diallel and different partial diallel mating designs. The computer simulations of this study were based on single nucleotide polymorphism haplotype data of 26 diverse maize inbreds. The power and proportion of false positives to detect three-way interactions with 5000 RILs derived from a nested design was relatively high for both the 4 QTL and the 12 QTL scenario. Higher power to detect three-way interactions was observed for RILs derived from optimally allocated distancebased designs than for RILs derived from a nested or diallel design. Our results suggested that association mapping methods adapted to the special features of plant breeding populations have the potential to overcome the limitations of classical linkage mapping methods

    Similar works