10 research outputs found

    Redes de similaridade para a classificação de genótipos de arroz quanto a sua adaptabilidade e estabilidade

    Get PDF
    The objective of this work was to evaluate the similarity network graphic methodology for the classification of flood-irrigated rice (Orzya sativa) genotypes regarding their adaptability and stability. Two statistical measures were used to represent the proximity of the behavior (based on Pearson’s correlation) or values (based on Gower’s distance) between pairs of genotypes or between genotype and environment. Productivity data of 18 genotypes were evaluated in three locations in the state of Minas Gerais, Brazil, in the harvests of 2012/2013, 2013/2014, 2014/2015, and 2015/2016, in a randomized complete block design. The genotypes were previously assessed for adaptability and stability by the Eberhart & Russell and centroid methods. The graphical representations provided by the similarity networks allowed to better identify the pattern of the genotype x environment interaction, overcoming the interpretation difficulties due to the disagreements between the results obtained by the Eberhart & Russell and centroid methods. The similarity networks improve genotype x environment interaction studies.O objetivo deste trabalho foi avaliar o método gráfico de rede de similaridade na classificação de genótipos de arroz (Orzya sativa) irrigado quanto a sua adaptabilidade e estabilidade. Duas medidas estatísticas foram utilizadas para representar a proximidade de comportamento (baseada na correlação de Pearson) ou de valores (baseada na distância de Gower) entre pares de genótipos ou entre genótipo e ambiente. Foram avaliados dados de produtividade de 18 genótipos de arroz irrigado em três locais de Minas Gerais, nas safras de 2012/2013, 2013/2014, 2014/2015 e 2015/2016, em delineamento em blocos ao acaso. Os genótipos foram previamente avaliados quanto à adaptabilidade e à estabilidade pelos métodos de Eberhart & Russell e centroide. As representações gráficas fornecidas pelas redes de similaridade facilitaram o reconhecimento do padrão de interação genótipo x ambiente, o que permitiu superar as dificuldades de interpretação devido à discordância entre os resultados obtidos com os métodos de Eberhart & Russell e centroide. As redes de similaridade facilitam os estudos de interação genótipo x ambiente

    Redes neurais artificiais comparadas com modelos lineares generalizados sob o enfoque bayesiano para predição de resistência à ferrugem em café arábica

    Get PDF
    The objective of this work was to evaluate the use of artificial neural networks in comparison with Bayesian generalized linear regression to predict leaf rust resistance in Arabica coffee (Coffea arabica). This study used 245 individuals of a F2 population derived from the self-fertilization of the F1 H511-1 hybrid, resulting from a crossing between the susceptible cultivar Catuaí Amarelo IAC 64 (UFV 2148-57) and the resistant parent Híbrido de Timor (UFV 443-03). The 245 individuals were genotyped with 137 markers. Artificial neural networks and Bayesian generalized linear regression analyses were performed. The artificial neural networks were able to identify four important markers belonging to linkage groups that have been recently mapped, while the Bayesian generalized model identified only two markers belonging to these groups. Lower prediction error rates (1.60%) were observed for predicting leaf rust resistance in Arabica coffee when artificial neural networks were used instead of Bayesian generalized linear regression (2.4%). The results showed that artificial neural networks are a promising approach for predicting leaf rust resistance in Arabica coffee.O objetivo deste trabalho foi avaliar o uso de redes neurais artificiais em comparação à modelagem por meio de modelos lineares generalizados na predição de resistência à ferrugem em café arábica (Coffea  arabica). Foram utilizados 245 indivíduos provenientes de uma população F2, oriundos da autofecundação do híbrido F1 H511-1, resultante do cruzamento da cultivar suscetível Catuaí Amarelo IAC 64 (UFV 2148-57) e do genitor resistente Híbrido de Timor (UFV 443-03). Os 245 indivíduos foram genotipados com 137 marcadores. Realizaram-se análises com redes neurais artificiais e com modelos lineares generalizados sob o enfoque bayesiano. As redes neurais identificaram quatro marcadores importantes pertencentes a grupos de ligação que foram recentemente mapeados, enquanto o modelo generalizado bayesiano identificou somente dois marcadores pertencentes a esses grupos. Foram observadas taxas de erro de predição inferiores (1,60%) para predizer a resistência à ferrugem em café arábica, quando foram utilizadas as redes neurais artificiais em vez de modelos lineares generalizados sob o enfoque bayesiano (2,4%). Os resultados mostraram que as redes neurais artificiais são uma abordagem promissora para predizer a resistência à ferrugem em café arábica

    Prediction of genetic values by genome wide selection and computational intelligence approaches

    No full text
    Os programas de melhoramento genético existem com dois objetivos principais: identificação de genótipos superiores e a obtenção de combinações melhoradas por meio de cruzamento entre esses indivíduos elite. Os mais diversos ramos da genética, estatística e biometria contribuíram para o estabelecimento de diferentes estratégias de melhoramento para seleção de genótipos superiores. Em particular, metodologias baseadas em seleção genômica ampla tem apresentado grande destaque dentre os estudos mais recentes de seleção. A seleção genômica ampla (Genome Wide Selection), envolve estudos biométricos e une genética de populações, genética molecular e a genética quantitativa. A maior motivação para tais estudos consiste na possibilidade de utilizar genotipagem em grande escala e incorporar informações genômicas no processo de predição, de modo a aumentar a eficiência seletiva, obter ganhos genéticos de forma mais ágil e diminuir os custos. Nos modelos de genética, as variações fenotípicas dos indivíduos consistem na variância genotípica dos mesmos agregando variâncias devido a dominância, variância ambiental e também epistasia. No entanto, os modelos de GWS, de modo geral, negligenciam a influência de dominância e epistasia, levando em consideração apenas os efeitos aditivos das características. Além disso, a alta densidade de marcadores moleculares pode levar a problemas de dimensionalidade e multicolinearidade. Neste contexto, o uso de estratégias de redução de dimensionalidade e de metodologias baseadas em inteligência computacional que abordem mais adequadamente a inclusão de tais efeitos em estudos de seleção e predição constituem a proposta neste trabalho. O trabalho visa abordar três tópicos principais: o capitulo propõe avaliar a eficiência do RR-BLUP para predição de valores genéticos de uma população simulada com 12 características complexas que contemplavam efeitos de dominância, epistasia e efeitos ambientais. No capítulo 2 propõe-se a aplicação dos Métodos de Regressão Stepwise e da Sonda para redução de dimensionalidade a fim de aumentar a eficiência preditiva do método RR-BLUP aplicado na mesma população considerada no capitulo 1. Finalmente, o capítulo 3 visa avaliar a eficiência das metodologias de inteligência computacional baseadas em Redes Neurais Artificiais de Redes Perceptron Multicamadas e as Redes de Função de Base Radial para predição dos valores genéticos da população simulada abordada nos capítulos anteriores. Os resultados indicaram que o uso de metodologias de redução de dimensionalidade contribui para o aumento da eficiência do método RR-BLUP. No entanto, também evidenciaram a deficiência desse método para predizer valores genéticos de populações que incluam efeitos de dominância e epistasia no controle gênico das características de interesse. As metodologias de Redes Neurais Multicamadas e as Redes de função de Base Radial propostas apresentaram acurácia preditiva, expressa pelo erro quadrático médio, superior à apresentada pelo RR-BLUP, demonstrando que as metodologias de inteligência computacional foram mais eficientes que a Seleção Genômica Ampla para o estudo de características complexas com controle gênico envolvendo efeitos aditivos, dominantes e epistáticos.Genetic breeding programs exist with two main objectives: to identify superior genotypes and to obtain improved combinations through cross-breeding among these elite individuals. The most diverse branches of genetics, statistics and biometry contributed to the establishment of different breeding strategies for selecting superior genotypes. In particular, methodologies based on genomic selection have shown great prominence among the most recent selection studies. Genome Wide Selection, involves biometric studies and gathers genetic of populations, molecular genetics and quantitative genetics. The greatest motivation for such studies is the possibility of using large-scale genotyping and incorporating genomic information into the prediction process, in order to increase selective efficiency, obtain genetic gains and reduce costs. In genetic models, the phenotypic variations of the individuals consist in the genotypic variance including variances due to dominance, environmental variance and also epistasis. However, the GWS models generally neglect the influence of dominance and epistasis, taking into consideration only the additive effects of the characteristics. In addition, the high density of molecular markers can lead to problems of dimensionality and multicollinearity. In this context, the use of dimensionality reduction strategies and methodologies based on computational intelligence that more adequately address the inclusion of effects due to dominance and epistasis in a selection and prediction study are the proposal in this work. The aim of this work is to address three main topics: Chapter ] proposes to evaluate the efficiency of RR-BLUP for predicting genetic values of a simulated population with 12 complex traits that included effects of dominance, epistasis and environmental effects. In Chapter 2 we propose the application of the Stepwise Regression and Sonda methods to reduce dimensionality in order to increase the predictive efficiency of the RR-BLUP method applied in the same population considered in chapter ]. Finally, chapter 3 aims to evaluate the efficiency of computational intelligence methodologies based on Artificial Neural Networks of Multilayer Perceptron and the Radial Basis Function Neural Networks to predict the genetic values of the simulated population discussed in previous chapters. The results indicated that the use of dimensionality reduction methodologies contribute to increase the efficiency of the RR-BLUP method. However, they also evidenced the deficiency of this method to predict genetic values for populations that include effects of dominance and epistasis in the gene control of the characteristics of interest. The methodologies of Multilayer Perceptron and Radial Basis Function Neural Networks proposed presented predictive accuracy, expressed by the mean square error, higher than that presented by the RR-BLUP, demonstrating that the computational intelligence methodologies were more efficient than the Genome Wide Selection for the study of complex characteristics with gene control involving additive, dominant and epistatic effects.Coordenação de Aperfeiçoamento de Pessoal de Nível Superio

    Artificial neural networks: a new paradigm for predicting genetic values

    No full text
    Até então, as formas de aumentar o ganho por seleção tem sido apontadas pelas diferentes estratégias preconizadas nos métodos de melhoramento, ou pela utilização dos princípios básicos da experimentação, ou ainda recorrer a modelos biométricos que buscam parametrizar as influências tanto genotípicas quanto ambientais. Assim, no que se refere aos métodos de genética e estatística utilizados para seleção de genótipos superiores, destacam-se os métodos derivados da teoria de seleção direta, seleção indireta e por índice de seleção, o método de seleção combinada e o método REML-BLUP, dentre outros. Apesar das diversas metodologias disponíveis para a seleção de genótipos superiores, ainda é comum e necessário praticar seleção de indivíduos em relação a características com baixa confiabilidade de predição do valor genotípico a partir de um valor fenotípico dado pela média fenotípica corrigida ou ajustada em função da agregação de informações de parentes, de caracteres correlacionados ou de práticas de redução do efeito ambiental. No final, considera-se esta média fenotípica ajustada como a medida mais apropriada para indicar a superioridade genética e predizer o ganho genético. No entanto, tais modelos ou procedimentos não contemplam uma infinidade de outras informações estatísticas de grande relevância, diferentes da média fenotípica que é usualmente adotada, mas que agregam informações importantes acerca do genótipo avaliado e que têm sido deixadas à margem dos estudos envolvendo melhoramento genético e critérios de seleção. Neste contexto, as redes neurais artificiais constituem novo paradigma que tem sido empregado, ainda que de forma tênue, nos programas de melhoramento genético animal e vegetal. Essa abordagem, diferentemente das modelagens estocásticas utilizadas até então, é baseada nos princípios de aprendizado e de inteligência computacional de um conjunto amplo de informação do desempenho do genótipo envolvendo médias, máximos, mínimos, variância e toda ordem de informação possível de ser direta ou indiretamente mensurada. Assim, ao contrário dos métodos estatísticos que resumem as informações ou realizam a simplificação estrutural dos dados, as redes neurais, à semelhança do cérebro humano, captam toda informação disponível para gerar um critério de tomada de decisão. Assim, este trabalho foi realizado com o intuito de utilizar as redes neurais para melhorar a acurácia na predição de valores e ganhos genéticos, através de uma discussão de seus fundamentos teóricos e utilização de dados simulados, com mesma caracterização em termos de média, herdabilidade e coeficiente de variação dos dados reais, fornecendo um método alternativo para identificação de genótipos superiores.Until then, how to increase the gain by selection has been pointed out by different strategies recommended in breeding methods, or by using the basic principles of experimentation, or even use biometric models that seek to parameterize both genotypic and environmental influences. Thus, as regards the methods of genetics and statistics used for selection of superior genotypes, highlight the methods derived from the theory of direct selection, indirect selection and index selection, combined selection method and REML-BLUP method among others. Despite several methodologies available for the selection of superior genotypes is still common and necessary practice selection of individuals in relation to features with low reliability of predicting genotype value from a phenotypic value given by the corrected or adjusted by the aggregate average phenotypic information from relatives of correlated traits or practices to reduce the environmental effect. In the end, we consider this phenotypic average adjusted as the most appropriate measure to indicate genetic superiority and predict genetic gain. However, such models or procedures do not include a multitude of other statistical information of great relevance, different phenotypic average which is usually adopted, but which provide important information about the reported genotype and who have been sidelined studies involving genetic improvement and selection criteria. In this context, artificial neural networks are a new paradigm that has been employed, albeit tenuously, in animal and plant breeding programs. This approach, unlike the stochastic modeling used so far, is based on principles of learning and computational intelligence on a wide range of performance information of genotype involving averages, maximum, minimum, variance and all sorts of information can be directly or indirectly measured. Thus, unlike the statistical methods that summarize the information or perform the structural simplification of data, neural networks, like the human brain, capture all available information to generate a criterion for decision making. This work was carried out with the intention of using neural networks to improve the accuracy of the predicted values and genetic gains, through a discussion of its theoretical foundations and use simulated data with the same characteristics in terms of average heritability and coefficient of variation of actual data by providing an alternative method for identification of superior genotypes.Coordenação de Aperfeiçoamento de Pessoal de Nível Superio

    Neural networks for predicting breeding values and genetic gains

    Get PDF
    Analysis using Artificial Neural Networks has been described as an approach in the decision-making process that, although incipient, has been reported as presenting high potential for use in animal and plant breeding. In this study, we introduce the procedure of using the expanded data set for training the network. Wealso proposed using statistical parameters to estimate the breeding value of genotypes in simulated scenarios, in addition to the mean phenotypic value in a feed-forward back propagation multilayer perceptron network. After evaluating artificial neural network configurations, our results showed its superiority to estimates based on linear models, as well as its applicability in the genetic value prediction process. The results further indicated the good generalization performance of the neural network model in several additional validation experiments

    Multigenerational prediction of genetic values using genome-enabled prediction.

    No full text
    The identification of elite individuals is a critical component of most breeding programs. However, the achievement of this goal is limited by the high cost of phenotyping and experimental research. A significant benefit of genomic selection (GS) to plant breeding is the identification of elite individuals without the need for phenotyping. This study aimed to propose different calibration strategies using combinations between generations from different genetic backgrounds to improve the reliability of GS and to investigate the effects of LD in different types of mating systems: outcrossing (An) self-pollination (Sn) and hybridization (Hn). For this purpose, we simulated a genome with 10 linkage groups. In each group, two QTL were simulated. Subsequently, an F2 population was created, followed by four generations of inbreeding (S1 to S4, H1 to H 4, A1, to A4,). Quantitative traits were simulated in three scenarios considering three degrees of dominance (d/a = 0, 0.5 and 1) and two broad sense heritabilities (h2 = 0.30 and 0.70), totaling six genetic architectures. To evaluate prediction reliability, a model (RR-BLUP) was trained in one generation and used to predict the following generations of mating systems. For example, the marker effects estimated in the F2 population were used to estimate the expected genomic breeding value (GEBV) in populations S1 through A4. The squared correlation between the GEBV and the true genetic value were used to measure the reliability of the predictions. Independently of the population used to estimate the marker effect, reliability showed the lowest values in the scenario where d = 1. For any scenario, the use of the multigenerational prediction methodology improved the reliability of GS

    Genomic prediction of leaf rust resistance to Arabica coffee using machine learning algorithms

    No full text
    Genomic selection (GS) emphasizes the simultaneous prediction of the genetic effects of thousands of scattered markers over the genome. Several statistical methodologies have been used in GS for the prediction of genetic merit. In general, such methodologies require certain assumptions about the data, such as the normality of the distribution of phenotypic values. To circumvent the non-normality of phenotypic values, the literature suggests the use of Bayesian Generalized Linear Regression (GBLASSO). Another alternative is the models based on machine learning, represented by methodologies such as Artificial Neural Networks (ANN), Decision Trees (DT) and related possible refinements such as Bagging, Random Forest and Boosting. This study aimed to use DT and its refinements for predicting resistance to orange rust in Arabica coffee. Additionally, DT and its refinements were used to identify the importance of markers related to the characteristic of interest. The results were compared with those from GBLASSO and ANN. Data on coffee rust resistance of 245 Arabica coffee plants genotyped for 137 markers were used. The DT refinements presented equal or inferior values of Apparent Error Rate compared to those obtained by DT, GBLASSO, and ANN. Moreover, DT refinements were able to identify important markers for the characteristic of interest. Out of 14 of the most important markers analyzed in each methodology, 9.3 markers on average were in regions of quantitative trait loci (QTLs) related to resistance to disease listed in the literature
    corecore