7 research outputs found

    Use of direct and iterative solvers for estimation of SNP effects in genome-wide selection

    Get PDF
    The aim of this study was to compare iterative and direct solvers for estimation of marker effects in genomic selection. One iterative and two direct methods were used: Gauss-Seidel with Residual Update, Cholesky Decomposition and Gentleman-Givens rotations. For resembling different scenarios with respect to number of markers and of genotyped animals, a simulated data set divided into 25 subsets was used. Number of markers ranged from 1,200 to 5,925 and number of animals ranged from 1,200 to 5,865. Methods were also applied to real data comprising 3081 individuals genotyped for 45181 SNPs. Results from simulated data showed that the iterative solver was substantially faster than direct methods for larger numbers of markers. Use of a direct solver may allow for computing (co)variances of SNP effects. When applied to real data, performance of the iterative method varied substantially, depending on the level of ill-conditioning of the coefficient matrix. From results with real data, Gentleman-Givens rotations would be the method of choice in this particular application as it provided an exact solution within a fairly reasonable time frame (less than two hours). It would indeed be the preferred method whenever computer resources allow its use

    Alternativas para redução de efeitos de multicolinearidade em modelos de avaliação de efeitos genéticos em bovinos de corte

    No full text
    O problema da multicolinearidade em análises de regressão foi abordado. A técnica da regressão de cumeeira foi empregada na estimação de parâmetros de efeitos genéticos sobre o desempenho de animais cruzados, por meio de dois modelos: um contendo apenas efeitos de ação aditiva e dominância (AD); e outro incluindo, além desses, efeitos de epistasia e complementariedade (ADEC). Um programa foi desenvolvido, em linguagem Fortran 90, para implementação de cinco versões da regressão de cumeeira: o método proposto originalmente; o implementado pelo SAS; e três formas de ponderação do coeficiente ë. Três critérios matemáticos para escolha de ë foram testados: a soma e a média harmônica dos valores absolutos da estatística t de Student, e o valor de ë a partir do qual os valores dos fatores de inflação de variância passavam a ser todos menores que trezentos. As comparações entre os cinco métodos e os três critérios foram feitas, usando-se o modelo ADEC, pelo exame de superfícies de predição obtidas a partir dos coeficientes estimados. Superfícies de predição também foram usadas para comparação entre os dois modelos, para cada método. Com o conjunto de dados utilizado, superfícies de predição biologicamente coerentes puderam ser obtidas em todos os métodos de implementação, usando-se o critério com base nos valores de FIV para determinação de ë. Recomenda-se que um critério matemático seja usado como ferramenta auxiliar para escolha de ë, não dispensando o exame dos sinais e valores das estimativas e um bom conhecimento do fenômeno em estudo. A inclusão de parâmetros para efeitos de epistasia e complementariedade em modelos de avaliação de efeitos genéticos em animais cruzados pôde representar um ganho tanto em termos de ajuste do modelo quanto de capacidade de predição de desempenho de genótipos não testados.The problem of multicollinearity in regression analysis was studied. Ridge regression techniques were used to estimate genetic parameters affecting performance of crossbred animals, using two models: the additive-dominance model; and an alternative model including additive, dominance, complementarity and epistatic effects. A software was developed, in Fortran 90, to perform five variant types of ridge regression: the originally proposed method; the one implemented by SAS; and three forms of weighting the ridge coefficient ë. Three mathematical criteria were tested with the aim of choosing a value for the ë coefficient: the sum and the harmonic mean of absolute Student t-values, and the value of ë from which all variance inflation factors (VIFs) became lower than 300. Prediction surfaces, obtained from estimated coefficients, were used to compare the five methods and three criteria, using the alternative model. Prediction surfaces were also used to compare the two models, for each method. In this study (and this particular data structure), prediction surfaces showed quite acceptable biological interpretation, for all five methods, when criterion based on VIF values was used to choose the ë coefficient. A mathematical criterion to choose ë is recommended as an indicator tool, without excluding an exam of signs and values of estimated coefficients, and a good understanding of the phenomenon under study. Inclusion of complementarity and epistatic effects, in models for genetic effects evaluation in crossbred animals, represented a better fit of the model, and an improvement in its ability to predict performance of untested genotypes.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES

    Uso das rotações de givens modificadas como um método direto para obtenção e atualização das soluções em sistemas com acumulação seqüencial de dados

    No full text
    O objetivo da pesquisa descrita nesta tese foi estudar possíveis aplicações do método das rotações modificadas de Givens na solução de sistemas de equações lineares tipicamente observados em problemas de melhoramento animal. Duas aplicações foram consideradas: a predição de valores genéticos com base em informação fenotípica e genealógica, por meio da metodologia dos modelos mistos; e a predição de valores genéticos com base em informação molecular, obtida pela genotipagem de painéis densos de SNPs. Na primeira aplicação, delineou-se o emprego de um modelo animal reduzido, combinado a uma ordenação do sistema que permitiu uma abordagem multi-frontal de decomposição. As matrizes frontais foram definidas como sendo as partes da triangular superior pertinentes a cada rebanho. Com isso, o problema pôde ser desmembrado em n subproblemas em que n é o número de rebanhos. Um conjunto de programas foi desenvolvido de modo a decompor as matrizes de dados de cada rebanho independentemente, e depois combinar as informações de todos eles na solução do sistema triangular geral, por retro-substituição. Concluiu-se que o método pode ser empregado em um sistema para atualização de predições de valor genético sob modelo animal reduzido, em que se aninham os efeitos de vacas dentro de rebanhos. Na segunda aplicação, comparou-se o emprego das rotações de Givens com o método do Gradiente Conjugado, na solução de sistemas lineares envolvidos na estimação de efeitos de SNPs em valores genéticos. O método das rotações demandou menos tempo de processamento e mais memória. Concluiu-se que, dado o crescente avanço em capacidade computacional, o método das rotações pode ser um método numérico viável e apresenta a vantagem de permitir o cálculo dos erros-padrão das estimativas.The aim of this study was to investigate possible applications of the modified Givens rotations on the solution of linear systems that typically arise in animal breeding problems. Two applications were considered: prediction of breeding values based on phenotypes and relationships, using mixed model methods; and prediction of breeding values based on molecular information, using genotypes from high density SNP chips. In the first application, the use of a reduced animal model, combined with a specific ordering of the system, made it possible to apply a multi-frontal decomposition approach. The frontal matrices were defined as the parts of the upper triangular corresponding to each herd. In this way, the problem could be partitioned into n subproblems, where n is the number of herds. A set of programs was developed in order to factorize the data matrix of each herd independently, and then combine the information from all of them while solving the overall triangular system, by back-substitution. The conclusion was that Givens rotations can be used as a numerical method for updating predicted breeding values under a reduced animal model, if dam effects are nested within herds. In the second application, the modified Givens rotations were compared to the Conjugate Gradient method for solving linear systems that arise in the estimation of SNP effects on breeding values. Givens rotations required less processing time but a greater amount of high speed memory. The conclusion was that, given the increasing rate of advance in computer power, Givens rotations can be regarded as a feasible numerical method which presents the advantage that it allows for the calculation of standard errors of estimates.Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES

    Estimativas de efeitos genéticos em bezerros cruzados por diferentes modelos e métodos de estimação

    No full text
    Os objetivos neste trabalho foram comparar estimativas de parâmetros genéticos obtidas por meio de dois modelos - um contendo apenas efeitos aditivos e de dominância e outro que incluiu os efeitos aditivo-conjunto (complementaridade) e epistático - e testar alternativas de critérios objetivos para determinação do coeficiente lambda na aplicação da regressão de cumeeira. Os resultados obtidos revelaram que a escolha de um critério para determinação do coeficiente lambda em regressão de cumeeira depende não apenas do conjunto de dados e do modelo utilizado, mas, sobretudo, de um conhecimento prévio acerca do fenômeno estudado e do significado prático e da interpretação dos parâmetros encontrados. Pelo uso de modelos mais completos para avaliação de efeitos genéticos em bovinos de corte, pode-se identificar a contribuição dos efeitos aditivo-conjunto e epistático, que encontram-se embutidos no efeito de heterose estimado por modelos mais simples. A regressão de cumeeira é uma ferramenta que viabiliza a obtenção dessas estimativas mesmo na presença de forte multicolinearidade.The purpose of this study was to compare estimates of genetic effects obtained using the additive-dominance model and another which included parameters for joint-additive (complementarity) and epistatic effects, as well as evaluate alternative objective criteria for choosing the lambda coefficient in ridge regression implementation. The results indicated that the criterion to be employed at the choice of lambda not only depends on the data set and the model used, but also on a previous knowledge about the phenomenon under study and the practical interpretation of estimated coefficients. When performing genetic effects evaluation, if other than additive and dominance effects are contemplated, it may be possible to identify and separate joint-additive and epistatic effects, which are usually inlaid in the heterotic effect estimated by the additive-dominance model. The use of ridge regression method can make such analyses possible even under strong multicollinearity

    Use of ridge regression for the prediction of early growth performance in crossbred calves

    No full text
    The problem of multicollinearity in regression analysis was studied. Ridge regression (RR) techniques were used to estimate parameters affecting the performance of crossbred calves raised in tropical and subtropical regions by a model including additive, dominance, joint additive or profit heterosis and epistatic effects and their interactions with latitude in an attempt to model genotype by environment interactions. A software was developed in Fortran 77 to perform five variant types of RR: the originally proposed method; the method implemented by SAS; and three methods of weighting the RR parameter lambda. Three mathematical criteria were tested with the aim of choosing a value for the lambda coefficient: the sum and the harmonic mean of the absolute Student t-values and the value of lambda at which all variance inflation factors (VIF) became lower than 300. Prediction surfaces obtained from estimated coefficients were used to compare the five methods and three criteria. It was concluded that RR could be a good alternative to overcome multicollinearity problems. For all the methods tested, acceptable prediction surfaces could be obtained when the VIF criterion was employed. This mathematical criterion is thus recommended as an auxiliary tool for choosing lambda.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)Conselho Nacional de Desenvolvimento Científico e Tecnológico (CNPq)Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (CAPES

    Characterisation of microbial attack on archaeological bone

    Get PDF
    As part of an EU funded project to investigate the factors influencing bone preservation in the archaeological record, more than 250 bones from 41 archaeological sites in five countries spanning four climatic regions were studied for diagenetic alteration. Sites were selected to cover a range of environmental conditions and archaeological contexts. Microscopic and physical (mercury intrusion porosimetry) analyses of these bones revealed that the majority (68%) had suffered microbial attack. Furthermore, significant differences were found between animal and human bone in both the state of preservation and the type of microbial attack present. These differences in preservation might result from differences in early taphonomy of the bones. © 2003 Elsevier Science Ltd. All rights reserved
    corecore