Genome wide association studies for production and reproduction traits in swine

Abstract

A análise de associação global do genoma (GWAS) visa identificar regiões cromossômicas associadas a características fenotípicas de interesse econômico, com base nas diferenças entre as frequências alélicas dos polimorfismos de base única (SNPs). O objetivo nesse estudo foi identificar SNPs no genoma suíno que influenciam características produtiva e reprodutiva, utilizando informações provenientes de animais de um programa de melhoramento de suínos. Neste trabalho foram utilizados dados genotípicos e fenotípicos de animais da raça Landrace (LA) e Large White (LW). Primeiramente foi realizado o controle de qualidade de amostras e dos SNPs. Após esta etapa, as análises GWAS para as características idade ajustada aos 100 kg de peso corporal (ID100) e a idade ao primeiro parto (IPP) foram realizadas com dados da raça LA. No controle de qualidade foram removidas amostras com problemas de discordância de sexo, paternidade, animais duplicados, eficiência de genotipagem (call rate) < 90%, desvios da heterozigosidade de ±3 desvios-padrão, além de verificar a estratificação e subestrutura da população. Para o controle de qualidade dos SNPs, foram removidos aqueles que apresentaram eficiência de genotipagem < 0,98, frequência do menor alelo (MAF) <0,03, equilíbrio de Hardy-Weinberg (EHW) com &#935;2 <10-6 e SNPs coincidentes. Estas análises foram realizadas por meio de rotinas elaboradas no programa R e no programa Plink. Após a remoção das amostras e dos SNPs que não passaram pelo controle de qualidade, restaram 604 amostras e 42.360 SNPs da raça LA e 345 amostras e 40.166 SNPs da raça LW. Para as análises de GWAS, por meio de marcadores únicos, foram utilizados dados fenotípicos previamente corrigidos para os efeitos de grupo contemporâneo para cada uma das características. O modelo incluiu os efeitos fixos da média e dos SNPs e os aleatórios infinitesimal e do resíduo. A matriz de parentesco continha informações das 3 últimas gerações dos animais genotipados. As análises de GWAS foram realizadas no programa QXPak. Foram considerados três limiares de significância: um conservador (valor de p = 5x10-7), um moderado (valor de p = 5x10-5) e outro baseado no critério de Bonferroni (valor de p = 1,18x10-6). Pela análise GWAS para a característica ID100 foram encontrados 22 SNPs significativos no cromossomo 1 e um SNP no cromossomo 4, considerando o limiar moderado. Para IPP foram encontrados dois SNPs significativos, sem posição definida no genoma. Para cada característica foi estimado o efeito aditivo do SNP mais significativo, estes foi de grande magnitude, de 2,22 dias para ID100 e de 4,69 dias para IPP, indicando grande potencial na inclusão destas informações na seleção. A análise de controle de qualidade foi efetiva na remoção de amostras e de SNPs com problemas de genotipagem. Futuras análises incluindo maior número de animais genotipados e a avaliação de metodologias adicionais permitirá detectar SNPs de menor efeito para as características estudadas.The aim of the genome wide association studies (GWAS) is to identify chromosome regions associated with phenotypic traits, based in differences between allele frequencies of single nucleotide polymorphisms (SNPs). The aim of this study was to identify SNPs in the swine genomes that influence productive and reproductive traits, using information from animals from a breeding swine program. It was used genotypic and phenotypic data from Landrace (LA) and Large White (LW) animals. First, it was performed quality control of samples and SNPs. After this step, the GWAS analysis for age adjusted to 100 kg and age at first farrowing traits, were performed only with LA data. The quality control for samples removed in the cases of disagreement on sex or paternity, duplicate animals, call rate < 90%, deviations of heterozygosity of more than ± 3 standard deviations, and check if there is stratification and substructure in the population. For the quality control of the SNPs, were removed those that have call rate < 0.98, the minor allele frequency (MAF) < 0.03, Hardy-Weinberg equilibrium (HWE) with &#967;2 < 10-6, and the SNPs that were coincident. The softwares R and Plink were used for this analysis. After removing samples and SNPs that were problematic, for the analysis remained 604 samples and 42,360 SNPs for LA and for LW there were 345 samples and 40,166 SNPs. For GWAS analysis, by single marker, phenotypic data were previously corrected for contemporary group effects for both traits. The model included as fixed effects the mean and the SNPs and as random infinitesimal effect and residue. The relationship matrix contains information of the last 3 generations of genotyped animals. It was considered 3 thresholds: a conservative (p-value = 5x10-7), a moderate (p- value = 5x10-5) and one based on Bonferroni test (p-value = 1.18x10-6). The GWAS analysis for age at 100 kg found 22 significant SNPs on chromosome 1 and one SNP on chromosome 4, considering the moderate threshold. For age at first farrowing, two SNPs were significant, with no defined position in the genome. For both traits, the additive effect estimated was of large magnitude, 2.22 days for age at 100 kg and 4.69 days for age at first farrowing, indicating a great potential of the inclusion of this information in selection to reduce these traits. The quality control analysis was effective to remove samples and SNPs with problems in genotyping. Further analysis including more genotyped animals and evaluation of additional methodologies may detect SNPs with minor effect for traits of interest.Coordenação de Aperfeiçoamento de Pessoal de Nível Superio

    Similar works