73 research outputs found

    Accuracy of Genomic Prediction in Dairy Cattle

    Get PDF
    Die genomische ZuchtwertschĂ€tzung ist vor allem im Bereich der Milchrinderzucht in den letzten Jahren zu einer beliebten Methode geworden, um sichere Zuchtwerte von Tieren ohne phĂ€notypische Information zu erhalten. Das Ziel dieser Arbeit war es, verschiedene Einflussfaktoren auf die Genauigkeit der genomischen ZuchtwertschĂ€tzung in realen RinderdatensĂ€tzen genauer zu untersuchen. In Kapitel 2 findet sich eine grundlegende Arbeit zur Kreuzvalidierung, in der die Eigenschaften verschiedener Kreuzvalidierungsstrategien in realen DatensĂ€tzen untersucht wurden. Kreuzvalidierung bedeutet, dass die verfĂŒgbaren Daten in eine Trainings- und eine Validierungsstichprobe aufgeteilt werden, wobei fĂŒr die Individuen in der Validierungsstichprobe alle Beobachtungswerte als nicht vorhanden angenommen werden. Die Werte der Individuen in der Validierungsstichprobe werden dann mit einem Modell, das mit Hilfe der Beobachtungswerte der Individuen in der Trainingsstichprobe angepasst wird, vorhergesagt. Im Kontext der genomischen ZuchtwertschĂ€tzung werden Kreuzvalidierungsstrategien benutzt, um die Genauigkeit der genomischen ZuchtwertschĂ€tzung mit einer bestimmten Trainingspopulation abzubilden. Die Korrelation zwischen maskierten und vorhergesagten Werten der Tiere in der Validierungsstichprobe spiegelt die Genauigkeit der genomischen ZuchtwertschĂ€tzung wider. Die Art und Weise, wie der Datensatz in Trainings- und Validierungsstichprobe unterteilt wird, kann die Ergebnisse einer Kreuzvalidierung beeinflussen. Das Ziel dieser Studie war es deshalb, optimale Strategien fĂŒr unterschiedliche Zwecke – Beschreibung der Genauigkeit der genomischen Vorhersage fĂŒr mögliche Selektionskandidaten mit dem vorhandenen Datensatz oder Vergleich von zwei Methoden zur Vorhersage – zu finden. Ein Datensatz von etwa 2‘300 Holstein Friesian-Bullen, die mit dem Illumina BovineSNP50 BeadChip (im Folgenden 50K Chip genannt) typisiert waren, wurde unterschiedlich aufgeteilt, so dass sich zwischen 800 bis 2‘200 Tiere in der Trainingsstichprobe und die jeweils restlichen Tiere in der Validierungsstichprobe befanden. Zwei BLUP-Modelle, eines mit einem zufĂ€lligen genomischen Effekt und eines mit einem zufĂ€lligen polygenen und einem zufĂ€lligen genomischen Effekt, wurden zur Vorhersage verwendet. Die höchste Genauigkeit der Vorhersage konnte mit der grĂ¶ĂŸten Trainingsstichprobe erreicht werden. Eine große Trainingsstichprobe bei gegebenem limitierten Datenmaterial impliziert aber auch, dass gleichzeitig die Validierungsstichproben klein und damit die Standardfehler der beobachteten Genauigkeiten sehr hoch sind. Falls es das Ziel einer Studie ist, signifikante Unterschiede zwischen Modellen nachzuweisen, ist es besser grĂ¶ĂŸere Validierungsstichproben zu verwenden. Eine fĂŒnffache Kreuzvalidierung scheint in vielen FĂ€llen ein guter Kompromiss zu sein. Die Verwandtschaftsstruktur zwischen den Tieren in der Trainings- und der Validierungsstichprobe hat einen großen Effekt auf die Genauigkeit der genomischen ZuchtwertschĂ€tzung. Momentan sind noch genĂŒgend nachkommengeprĂŒfte Bullen in den Trainingsstichproben vorhanden, mit denen die Tiere in der Validierungsstichprobe hoch verwandt sind. Wenn die genomische Selektion konsequent angewendet wird, ist es möglich, dass solche Individuen fĂŒr die Trainingsstichprobe knapper werden. Deshalb enthĂ€lt Kapitel 3 eine Studie, die untersucht, wie sich die Verwandtschafts- und Altersstruktur auf die Genauigkeit der genomischen Zuchtwerte von jungen Bullen auswirkt. Ein Datensatz mit 5‘698 Bullen der Rasse Holstein Friesian, die alle mit dem 50K Chip typisiert wurden und zwischen 1981 und 2005 geboren wurden, war die Basis dieser Arbeit. In allen Szenarien wurden die 500 jĂŒngsten Bullen dieses Datensatzes als Validierungsstichprobe verwendet. Verschiedene Trainingsstichproben mit je 1‘500 Individuen wurden ausgewĂ€hlt, um die genomischen Zuchtwerte der jungen Tiere (Selektionskandidaten) vorherzusagen: eine zufĂ€llige Auswahl an Bullen, die Ă€ltesten und jĂŒngsten verfĂŒgbaren Tiere, Tiere mit Verwandtschaftskoeffizienten kleiner 0.25 oder 0.5 zu allen Selektionskandidaten, oder Tiere, die am stĂ€rksten mit den Selektionskandidaten verwandt waren. Verglichen mit dem Szenario mit der zufĂ€lligen Auswahl fĂŒhrte eine Verringerung der Verwandtschaft zu einer sichtbaren Abnahme der Genauigkeit der genomischen Vorhersage. Die Genauigkeit fĂŒr die Szenarien mit den hoch verwandten Tieren bzw. den jĂŒngsten Tieren in der Trainingsstichprobe war hingegen höher. FĂŒr die praktische Anwendung bedeutet dies, dass in stark verwandten Gruppen wie Elitebullen der Rasse Holstein Friesian keine weiteren Probleme fĂŒr die Vorhersage junger Tiere zu erwarten sind, solange VĂ€ter, Voll- und Halbgeschwister in der Trainingsstichprobe vorhanden sind. Neue nachkommengeprĂŒfte Bullen sollten deshalb kontinuierlich zur Trainingsstichprobe hinzugefĂŒgt werden – sonst wird eine klare Abnahme der Genauigkeit schon nach ein oder zwei Generationen zu sehen sein. Kapitel 4 beschĂ€ftigt sich mit zwei weiteren Faktoren, die die Genauigkeit der genomischen Vorhersage beeinflussen können: Markerdichte und Methodenwahl. Bis jetzt wurden normalerweise 50K SNPs fĂŒr die genomische ZuchtwertschĂ€tzung verwendet, aber seit Kurzem ist auch ein neues hochdichtes SNP-Array mit 777K SNPs verfĂŒgbar. Dies lĂ€sst die Frage aufkommen, ob die höhere Markerdichte zu einem Anstieg in der Genauigkeit fĂŒhren kann. Je mehr Marker verfĂŒgbar sind, umso grĂ¶ĂŸer wird auch die Notwendigkeit, Methoden zu entwickeln, die einen Teil der Marker als nicht informativ (d.h. ohne Effekt auf das untersuchte Merkmal) zulassen. Deshalb wurde eine neue und effiziente Bayes’sche Methode (BayesR) entwickelt, die annimmt, dass die SNP Effekte aus einer Reihe von Normalverteilungen stammen, die unterschiedliche Varianzen haben. Die Anzahl der SNPs pro Verteilung wird nicht festgesetzt, sondern mit Hilfe einer Dirichlet-Verteilung modelliert. In Kapitel 4 wird außerdem auf die Frage eingegangen, wie sich die Genauigkeit der Vorhersage im Fall von Trainingsstichproben mit mehreren Rassen bei unterschiedlicher Markerdichte verhĂ€lt. Bei Milchrinderrassen sind große Trainingsstichproben erforderlich, um robuste SchĂ€tzer der SNP-Effekte zu erhalten, aber gerade bei kleinen Rassen kann es schwierig sein, solch große Trainingsstichproben aufzubauen. Trainingsstichproben, die Tiere mehrerer Rassen enthalten, können deshalb eine Möglichkeit sein, dieses Problem zu umgehen. Mit 50K SNPs war der Erfolg solcher Mehrrassen-Trainingsstichproben gering, was darauf zurĂŒckgefĂŒhrt wurde, dass die Haplotypenstruktur ĂŒber die Rassen hinweg bei dieser Markerdichte nicht konsistent war. Der hochdichte SNP-Chip könnte hier allerdings Verbesserungen fĂŒr die Vorhersage ĂŒber Rassen hinweg bringen. Die VerĂ€nderungen in der Genauigkeit der genomischen ZuchtwertschĂ€tzung innerhalb einer Rasse und ĂŒber Rassen hinweg wurden mit Daten von australischen Bullen der Rassen Holstein Friesian und Jersey, die mit dem 50K Chip typisiert und auf 777K SNPs imputet waren, und zwei verschiedenen Methoden (GBLUP, BayesR) untersucht. Die Verwendung von imputeten hochdichten Markern fĂŒhrte zu keinem signifikanten Anstieg der Genauigkeit innerhalb einer Rasse und nur zu einer geringen Verbesserung der Genauigkeit in der kleineren Rasse im Mehrrassen-Szenario. BayesR lieferte gleichwertige oder in vielen FĂ€llen höhere Genauigkeiten als GBLUP. Eine Eigenschaft von BayesR ist außerdem, dass es möglich ist, aus den Ergebnissen Erkenntnisse zur genetischen Architektur des Merkmals zu erhalten, z.B. indem man die durchschnittliche Anzahl an SNPs in den verschiedenen Verteilungen betrachtet. Die Genauigkeit der genomischen ZuchtwertschĂ€tzung kann mit verschiedenen Validierungsprozeduren berechnet werden, sobald reale Daten vorhanden sind. In manchen Situationen kann es jedoch von Vorteil sein, wenn man die erwartete Genauigkeit der Vorhersage im Vorfeld einer Studie abschĂ€tzen kann, z.B. um zu wissen, welche GrĂ¶ĂŸe die Trainingsstichprobe haben sollte oder wie hoch die Markerdichte sein sollten, um eine bestimmte Genauigkeit zu erreichen. Verschiedene deterministische Formeln zur AbschĂ€tzung der erreichbaren Genauigkeit sind in der Literatur verfĂŒgbar, die alle auf den mehr oder weniger gleichen Parametern beruhen. Einer dieser Parameter ist die Anzahl unabhĂ€ngig segregierender Chromosomensegmente (Me), die normalerweise mit Hilfe von theoretischen Werten wie der effektiven PopulationsgrĂ¶ĂŸe (Ne) deterministisch bestimmt wird. In Kapitel 5 wird ein Maximum-Likelihood Ansatz beschrieben, der es ermöglicht, Me basierend auf systematisch angelegten Kreuzvalidierungsexperimenten empirisch zu bestimmen. Darauf aufbauend wurden verschiedene deterministische Funktionen zur Vorhersage der Genauigkeit verglichen und so modifiziert, dass sie am besten zu den vorhandenen DatensĂ€tzen passten. Mit 5‘698 Holstein Friesian-Bullen, die mit dem 50K Chip typisiert waren, und 1‘333 Braunvieh-Bullen, die mit dem 50K Chip typisiert und auf 777K SNPs imputet waren, wurden mit GBLUP verschiedene k-fache Kreuzvalidierungen (k=2, 3, 
, 10, 15, 20) durchgefĂŒhrt. So konnte eine genomische ZuchtwertschĂ€tzung bei unterschiedlichen GrĂ¶ĂŸen der Trainingsstichprobe nachgebildet werden. Weiterhin wurden alle Szenarien mit verschiedenen Subsets der vorhandenen SNPs (10‘000, 20‘000, 30‘000, 42‘551 SNPs fĂŒr Holstein Friesian, und jeder, jeder zweite, jeder 4., 
 jeder 256. SNP fĂŒr Braunvieh) durchgefĂŒhrt, um den Einfluss der Markerdichte erfassen zu können. Der Maximum-Likelihood Ansatz wurde angewendet, um Me fĂŒr die beiden vorhandenen DatensĂ€tze bestmöglich zu schĂ€tzen. Die höchste Likelihood wurde erreicht, wenn eine modifizierte Form der deterministischen Formel von Daetwyler et al. (2010, Genetics 185:1021-1031) fĂŒr die Modellierung der erwarteten Genauigkeit die Grundlage bildete. Die wahrscheinlichsten Werte fĂŒr Me, wenn alle vorhandenen Marker genutzt wurden, waren 1‘241 (412) und 1‘046 (197) fĂŒr die Merkmale Zellzahl und Milchmenge fĂŒr Holstein Friesian (Braunvieh). Die Werte fĂŒr Me fĂŒr Braunvieh und Holstein Friesian unterschieden sich deutlich, wĂ€hrend Ne fĂŒr beide Populationen (berechnet auf Basis des Pedigrees oder ĂŒber die Struktur des Kopplungsungleichgewichts) sehr Ă€hnlich war. Die SchĂ€tzungen fĂŒr Me variierten zwischen verschiedenen Merkmalen innerhalb von Populationen und ĂŒber Populationen mit Ă€hnlichen Populationsstrukturen hinweg. Dies zeigt, dass Me wahrscheinlich kein Parameter ist, der sich nur aus Ne und der LĂ€nge des Genoms berechnen lĂ€sst. Die Modifizierung der Formel von Daetwyler et al. (2010) bestand darin, einen Gewichtungsfaktor hinzuzufĂŒgen, der berĂŒcksichtigt, dass die maximale Genauigkeit bei gegebener Markerdichte auch mit unendlich großer Trainingsstichprobe nicht 1 sein muss. Dies basiert auf der Annahme, dass die vorhandenen SNPs nicht die ganze genetische Varianz wiedergeben können. Auch dieser Gewichtungsfaktor wurde empirisch bestimmt. Die quadrierten Werte, d.h. der Prozentsatz der genetischen Varianz, die erklĂ€rt wird, lagen zwischen 76% und 82% fĂŒr 10‘000 bis 42‘551 SNPs bei Holstein Friesian und zwischen 63% und 75% fĂŒr 2‘451 bis 627‘306 SNPs bei Braunvieh. Zwischen dem natĂŒrlichen Logarithmus der Markerdichte und dem Gewichtungsfaktor bestand ein linearer Zusammenhang bis zu einer populationsspezifischen Grenze hinsichtlich der Markerdichte (~ 20‘000 SNPs bei Braunvieh). Oberhalb dieser Grenze fand sich ein Plateau, was bedeutet, dass das HinzufĂŒgen von weiteren Markern den Anteil der genetischen Varianz, der erklĂ€rt wird, nicht mehr verĂ€ndert

    Predicting Genetic Values: A Kernel-Based Best Linear Unbiased Prediction With Genomic Data

    Get PDF
    Genomic data provide a valuable source of information for modeling covariance structures, allowing a more accurate prediction of total genetic values (GVs). We apply the kriging concept, originally developed in the geostatistical context for predictions in the low-dimensional space, to the high-dimensional space spanned by genomic single nucleotide polymorphism (SNP) vectors and study its properties in different gene-action scenarios. Two different kriging methods [“universal kriging” (UK) and “simple kriging” (SK)] are presented. As a novelty, we suggest use of the family of MatĂ©rn covariance functions to model the covariance structure of SNP vectors. A genomic best linear unbiased prediction (GBLUP) is applied as a reference method. The three approaches are compared in a whole-genome simulation study considering additive, additive-dominance, and epistatic gene-action models. Predictive performance is measured in terms of correlation between true and predicted GVs and average true GVs of the individuals ranked best by prediction. We show that UK outperforms GBLUP in the presence of dominance and epistatic effects. In a limiting case, it is shown that the genomic covariance structure proposed by VanRaden (2008) can be considered as a covariance function with corresponding quadratic variogram. We also prove theoretically that if a specific linear relationship exists between covariance matrices for two linear mixed models, the GVs resulting from BLUP are linked by a scaling factor. Finally, the relation of kriging to other models is discussed and further options for modeling the covariance structure, which might be more appropriate in the genomic context, are suggested

    A scale-corrected comparison of linkage disequilibrium levels between genic and non-genic regions

    Get PDF
    The understanding of non-random association between loci, termed linkage disequilibrium (LD), plays a central role in genomic research. Since causal mutations are generally not included in genomic marker data, LD between those and available markers is essential for capturing the effects of causal loci on localizing genes responsible for traits. Thus, the interpretation of association studies requires a detailed knowledge of LD patterns. It is well known that most LD measures depend on minor allele frequencies (MAF) of the considered loci and the magnitude of LD is influenced by the physical distances between loci. In the present study, a procedure to compare the LD structure between genomic regions comprising several markers each is suggested. The approach accounts for different scaling factors, namely the distribution of MAF, the distribution of pair-wise differences in MAF, and the physical extent of compared regions, reflected by the distribution of pair-wise physical distances. In the first step, genomic regions are matched based on similarity in these scaling factors. In the second step, chromosome- and genome-wide significance tests for differences in medians of LD measures in each pair are performed. The proposed framework was applied to test the hypothesis that the average LD is different in genic and non-genic regions. This was tested with a genome-wide approach with data sets for humans (Homo sapiens), a highly selected chicken line (Gallus gallus domesticus) and the model plant Arabidopsis thaliana. In all three data sets we found a significantly higher level of LD in genic regions compared to non-genic regions. About 31% more LD was detected genome-wide in genic compared to non-genic regions in Arabidopsis thaliana, followed by 13.6% in human and 6% chicken. Chromosome-wide comparison discovered significant differences on all 5 chromosomes in Arabidopsis thaliana and on one third of the human and of the chicken chromosomes

    Assessing various environmental descriptors with respect to genotype x environment interaction for milk production traits in Bavarian Fleckvieh cattle

    No full text
    Genotype x environment (GxE) interaction for production traits in Fleckvieh cattle was assessed by means of various environmental descriptors (EDs). It was also of particular interest to search for EDs useful for studying differing robustness or resilience of individuals which implies reasonable GxE interaction. The set of studied EDs included farm/herd environment (e.g. herd size, housing/feeding regimes, herd production level), geographical location (e.g. height above sea level), temperature humidity index and fat-to-protein ratio. Milk, fat and protein yield deviations for the first test day, the first 100 days and the 305-day-yield of the first lactation were used as phenotypes. Genetic correlations were estimated with bi- and multivariate sire models in case of categorical EDs and reaction norm sire models in case of continuous EDs. Further, rank correlations of bulls' estimated breeding values were calculated for different environmental levels/classes. Almost all estimated genetic correlations were significantly different from 1, but not <0.93. There were some exceptions for extremely different classes/levels of some EDs (e.g. average herd-year production, organic vs conventional farm systems, way of concentrated feed supply). Rank correlations were rarely below 0.95. In summary, no substantial GxE interactions for milk production traits were found with the studied EDs

    Whole-genome sequence-based genomic prediction in laying chickens with different genomic relationship matrices to account for genetic architecture

    Get PDF
    Abstract Background With the availability of next-generation sequencing technologies, genomic prediction based on whole-genome sequencing (WGS) data is now feasible in animal breeding schemes and was expected to lead to higher predictive ability, since such data may contain all genomic variants including causal mutations. Our objective was to compare prediction ability with high-density (HD) array data and WGS data in a commercial brown layer line with genomic best linear unbiased prediction (GBLUP) models using various approaches to weight single nucleotide polymorphisms (SNPs). Methods A total of 892 chickens from a commercial brown layer line were genotyped with 336\ua0K segregating SNPs (array data) that included 157\ua0K genic SNPs (i.e. SNPs in or around a gene). For these individuals, genome-wide sequence information was imputed based on data from re-sequencing runs of 25 individuals, leading to 5.2 million (M) imputed SNPs (WGS data), including 2.6\ua0M genic SNPs. De-regressed proofs (DRP) for eggshell strength, feed intake and laying rate were used as quasi-phenotypic data in genomic prediction analyses. Four weighting factors for building a trait-specific genomic relationship matrix were investigated: identical weights, \u2212(log 10 P ) from genome-wide association study results, squares of SNP effects from random regression BLUP, and variable selection based weights (known as BLUP|GA). Predictive ability was measured as the correlation between DRP and direct genomic breeding values in five replications of a fivefold cross-validation. Results Averaged over the three traits, the highest predictive ability (0.366\ua0\ub1\ua00.075) was obtained when only genic SNPs from WGS data were used. Predictive abilities with genic SNPs and all SNPs from HD array data were 0.361\ua0\ub1\ua00.072 and 0.353\ua0\ub1\ua00.074, respectively. Prediction with \u2212(log 10 P ) or squares of SNP effects as weighting factors for building a genomic relationship matrix or BLUP|GA did not increase accuracy, compared to that with identical weights, regardless of the SNP set used. Conclusions Our results show that little or no benefit was gained when using all imputed WGS data to perform genomic prediction compared to using HD array data regardless of the weighting factors tested. However, using only genic SNPs from WGS data had a positive effect on prediction ability

    A function accounting for training set size and marker density to model the average accuracy of genomic prediction.

    Get PDF
    Prediction of genomic breeding values is of major practical relevance in dairy cattle breeding. Deterministic equations have been suggested to predict the accuracy of genomic breeding values in a given design which are based on training set size, reliability of phenotypes, and the number of independent chromosome segments ([Formula: see text]). The aim of our study was to find a general deterministic equation for the average accuracy of genomic breeding values that also accounts for marker density and can be fitted empirically. Two data sets of 5'698 Holstein Friesian bulls genotyped with 50 K SNPs and 1'332 Brown Swiss bulls genotyped with 50 K SNPs and imputed to ∌600 K SNPs were available. Different k-fold (k = 2-10, 15, 20) cross-validation scenarios (50 replicates, random assignment) were performed using a genomic BLUP approach. A maximum likelihood approach was used to estimate the parameters of different prediction equations. The highest likelihood was obtained when using a modified form of the deterministic equation of Daetwyler et al. (2010), augmented by a weighting factor (w) based on the assumption that the maximum achievable accuracy is [Formula: see text]. The proportion of genetic variance captured by the complete SNP sets ([Formula: see text]) was 0.76 to 0.82 for Holstein Friesian and 0.72 to 0.75 for Brown Swiss. When modifying the number of SNPs, w was found to be proportional to the log of the marker density up to a limit which is population and trait specific and was found to be reached with ∌20'000 SNPs in the Brown Swiss population studied

    Genetic parameters for semen production traits in Swiss dairy bulls

    No full text
    Variance components (VC) were estimated for the semen production trait ejaculate volume, sperm concentration and sperm motility in the Swiss cattle breeds Brown Swiss (BS), Original Braunvieh (OB), Holstein (HO), Red‐Factor‐Carrier (RF), Red Holstein (RH), Swiss Fleckvieh (SF) and Simmental (SI). For this purpose, semen production traits from 2,617 bulls with 124,492 records were used. The data were collected in the years 2000–2012. The model for genetic parameter estimation across all breeds included the fixed effects age of bull at collection, year of collection, month of collection, number of collection per bull and day, interval between consecutive collections, semen collector, bull breed as well as a random additive genetic component and a permanent environmental effect. The same model without a fixed breed effect was used to estimate VC and repeatabilities separately for each of the breeds BS, HO, RH, SF and SI. Estimated heritabilities across all breeds were 0.42, 0.25 and 0.09 for ejaculate volume, sperm concentration and sperm motility, respectively. Different heritabilities were estimated for ejaculate volume (0.42; 0.45; 0.49; 0.40; 0.10), sperm concentration (0.34; 0.30; 0.20; 0.07; 0.23) and number of semen portions (0.18; 0.30; 0.04; 0.14; 0.04) in BS, HO, RH, SF and SI breed, respectively. The phenotypic and genetic correlations across all breeds between ejaculate volume and sperm concentration were negative (−0.28; −0.56). The other correlations across all breeds were positive. The phenotypic and genetic correlations were 0.01 and 0.19 between sperm motility and ejaculate volume, respectively. Between sperm motility and sperm concentration, the phenotypic and genetic correlations were 0.20 and 0.36, respectively. The results are consistent with other analyses and show that genetic improvement through selection is possible in bull semen production traits

    Genome Scan for Selection in Structured Layer Chicken Populations Exploiting Linkage Disequilibrium Information

    No full text
    An increasing interest is being placed in the detection of genes, or genomic regions, that have been targeted by selection because identifying signatures of selection can lead to a better understanding of genotype-phenotype relationships. A common strategy for the detection of selection signatures is to compare samples from distinct populations and to search for genomic regions with outstanding genetic differentiation. The aim of this study was to detect selective signatures in layer chicken populations using a recently proposed approach, hapFLK, which exploits linkage disequilibrium information while accounting appropriately for the hierarchical structure of populations. We performed the analysis on 70 individuals from three commercial layer breeds (White Leghorn, White Rock and Rhode Island Red), genotyped for approximately 1 million SNPs. We found a total of 41 and 107 regions with outstanding differentiation or similarity using hapFLK and its single SNP counterpart FLK respectively. Annotation of selection signature regions revealed various genes and QTL corresponding to productions traits, for which layer breeds were selected. A number of the detected genes were associated with growth and carcass traits, including IGF-1R, AGRP and STAT5B. We also annotated an interesting gene associated with the dark brown feather color mutational phenotype in chickens (SOX10). We compared FST, FLK and hapFLK and demonstrated that exploiting linkage disequilibrium information and accounting for hierarchical population structure decreased the false detection rate
    • 

    corecore