16 research outputs found

    Aditividade de variâncias obtidas por bootstrap de estimativas de parâmetros genéticos populacionais

    Get PDF
    O estudo da estrutura genética de populações naturais é muito importante para a conservação e o uso da variabilidade genética disponível na natureza. Esta pesquisa relaciona-se com a análise da estrutura genética de populações a partir de dados moleculares reais e simulados. Visando estimar variâncias de estimativas de parâmetros pertinentes, o método de reamostragem bootstrap foi aplicado levando em conta diferentes unidades amostrais, a saber: indivíduos dentro de populações (I), populações (P) e indivíduos e populações concomitantemente (I, P). Os parâmetros considerados foram: o índice de fixação total (F ou F IT), o indice de fixação intrapopulacional (f ou F IS) e a divergência interpopulacional (teta ou F ST). O trabalho objetivou estimar a variância amostral das estimativas destes parâmetros para verificar se as variâncias de ;, ;e ;, obtidas pela reamostragem de indivíduos e populações concomitantemente (I, P) são equivalentes às obtidas pela soma (I+P) das variâncias estimadas reamostrando-se I e P separadamente. A equivalência foi verificada em todos os casos investigados, mostrando ser possível estimar as variâncias das estimativas de ;, ;e ;, para cada fonte de variação (unidade amostral) somando-as depois para estimar a variância total. O procedimento facilita o uso do método bootstrap em dados com estrutura hierárquica e permite mensurar a importância relativa de cada fonte de variação sobre a variância amostral total das estimativas dos parâmetros.Studying the genetic structure of natural populations is very important for conservation and use of the genetic variability available in nature. This research is related to genetic population structure analysis using real and simulated molecular data. To obtain variance estimates of pertinent parameters, the bootstrap resampling procedure was applied over different sampling units, namely: individuals within populations (I), populations (P), and individuals and populations simultaneously (I, P). The considered parameters were: the total fixation index (F or F IT), the fixation index within populations (f or F IS) and the divergence among populations or intrapopulation coancestry (theta or F ST). The aim of this research was to verify if the variance estimates of ;, ;and ;, found through the resampling over individuals and populations simultaneously (I, P), correspond to the sum of the respective variance estimates obtained from separated resampling over individuals and populations (I+P). This equivalence was verified in all cases, showing that the total variance estimate of ;, ;and ;can be obtained summing up the variances estimated for each source of variation separately. Results also showed that this facilitates the use of the bootstrap method on data with hierarchical structure and opens the possibility of obtaining the relative contribution of each source of variation to the total variation of estimated parameters

    Combining ability of inbred lines of maize and stability of their respective single-crosses

    Get PDF
    No melhoramento de milho (Zea mays L.), a utilização de cruzamentos dialélicos visando identificação de combinações superiores é uma prática comum. Esta metodologia visa estimar a capacidade de combinação dos materiais avaliados. Neste trabalho, cinco linhagens endogâmicas foram avaliadas quanto às capacidades gerais (CGC) e específica (CEC) de combinação, utilizando o esquema de dialelo completo. Os híbridos simples produzidos entre estas linhagens foram avaliados em sete ambientes, juntamente com duas testemunhas, tendo-se utilizado o delineamento de blocos casualizados. Avaliaram-se os caracteres: produção de grãos, altura da planta, altura da espiga, posição relativa da espiga e prolificidade. Realizou-se a análise dialélica, seguindo uma adaptação do método IV de Griffing, além das análises de estabilidade e adaptabilidade dos híbridos. Detectaram-se diferenças significativas para tratamentos e ambientes para todos os caracteres. A interação genótipos por ambientes foi significativa para maioria dos caracteres. As CGCs foram significativas para todos os caracteres, enquanto que a CEC foi não significativa apenas para posição relativa da espiga. Para o caráter produção de grãos, tanto os efeitos aditivos (CGC) quanto não aditivos (CEC) foram importantes, enquanto que para os demais caracteres, houve predominância dos efeitos aditivos. O híbrido mais produtivo foi obtido entre as linhagens L-08-05F e L-38-05D. Suas linhagens apresentaram elevadas CGCs e seu híbrido, elevada CEC, além de ter sido responsivo à melhoria das condições ambientais e razoavelmente estável. O segundo híbrido mais produtivo, L-46-10D x L-08-05F, mostrou ampla adaptabilidade e estabilidade.The utilization of diallel crosses for identification of superior combinations is a common practice in maize (Zea mays L.) breeding programs. This methodology allows the estimation of the combining ability of genotypes being evaluated. In this work, five inbred lines were evaluated as to their general (GCA) and specific (SCA) combining abilities, by using a complete diallel scheme. The single-crosses produced between these inbred lines were evaluated in seven environments, along with two checks, by using a randomized complete block design. Traits analized were: grain yield, plant height, ear height, ear placement, and prolificacy. A diallel analysis was carried out, following an adaptation of Griffing's method IV, in addition to hybrid stability and adaptability analyses. Significant differences were detected for entries and environments for all traits. The interaction genotype vs. environment was significant for all traits. GCA's were significant for all traits, while SCA's were non-significant only for ear placement. For grain yield, both additive (GCA) and non-additive (SCA) effects were important, while for the remaining traits additive effects were more important. The high yielding single-cross was obtained from the cross of lines L-08-05F and L-38-05D. Those inbred lines showed higher GCA's and their cross also had high SCA; also, it is responsive to environment improvements and reasonably stable. The second in rank high yielding single-cross, L-46-10D x L-08-05F, showed wide adaptability and stability

    Use of Bootstrap in the estimation of population genetic parameters

    No full text
    Muitos autores têm utilizado marcadores isoenzimáticos ou moleculares para estudar a estrutura genética e o sistema reprodutivo de populações naturais. Para tanto, parâmetros populacionais de interesse são estimados, mas há pouca informação sobre o erro associado a essas estimativas em função dos diferentes níveis de amostragem. Através dessa informação, estratégias de amostragem poderiam ser estabelecidas de modo a reduzir a magnitude dos erros associados a tais estimativas. No presente trabalho foram utilizados conjuntos de dados reais, além de dados simulados em algumas situações. Para os dados reais, foram feitas reamostragens bootstrap de locos, indivíduos, populações, e indivíduos e populações concomitantemente. Para os parâmetros índice de fixação total (F), diversidade entre populações ou grau de coancestralidade nas populações (θ), índice de fixação dentro das populações (ƒ), taxa aparente de cruzamento (ta), fluxo de genes entre populações (Nm) e tamanho efetivo populacional (Ne) foi possível obter, em função das diferentes fontes de reamostragem, os erros associados às estimativas desses parâmetros, a distribuição empírica dessas estimativas e intervalos de confiança para tais parâmetros. Em geral, as menores variâncias estão associadas às estimativas de θ. O contrário foi observado para F, ƒ e Nm. Verificou-se que apenas as distribuições empíricas de F̂ e f̂; tendem à normalidade. Isso ocorreu somente quando foram feitas reamostragens envolvendo indivíduos, possivelmente por serem mais numerosos que populações e locos. A partir dos dados reais e simulados, para os parâmetros F, ƒ e θ individualmente e em conjunto, verificou-se que as estimativas das variâncias devidas à reamostragem de indivíduos e de populações isoladamente são aditivas. Consequentemente, pode-se calcular a contribuição relativa destas duas fontes de variação para a variância total das estimativas. Foi possível concluir que dois métodos de verificação da importância relativa das causas de variação de populações e de indivíduos, como fonte de erros das estimativas dos parâmetros F, ƒ e θ, em geral, apresentaram resultados concordantes. Para obter o número necessário de locos, indivíduos e populações, visando atingir uma determinada precisão na estimação de F, ƒ e θ, foram feitas reamostragens com tamanho variável de amostras bootstrap. Para os diversos níveis dos fatores locos, indivíduos e populações, foram estimadas as respectivas variâncias e construídas curvas de regressão entre o número de populações, ou indivíduos ou locos e os erros de estimação associados. Em geral, os tamanhos amostrais utilizados nas pesquisas com populações naturais foram suficientes apenas para estimar θ, considerando a magnitude estabelecida para os erros das estimativas. Observou-se também que a fonte de variação de locos foi responsável pelos maiores erros das estimativas dos parâmetros F e ƒ. Portanto, em pesquisas futuras dessa natureza, é recomendável atentar para a necessidade de trabalhar com número adequado de locos. Este número certamente deve ser maior do que o comumente utilizado. A fonte de variação de populações também foi importante na estimação dos parâmetros F e θ, devendo assim merecer a devida atenção. Diante dessas informações, evidencia-se a importância da aplicação de bootstrap na mensuração da precisão de estimativas de parâmetros populacionais, em função das diversas fontes de variaçãoGenetic structure and mating system of natural populations have often been studied using molecular markers and isozymes. Specific genetic parameters are therefore being estimated for this purpose. There is little information about errors associated with these estimates due to different possible sampling leveis. The knowledge of this information could be used to minimize the magnitude of the errors associated with such estimates. Real and simulated datasets were used in this study. With the real datasets, bootstrapping over loci, individuals, populations and both individuals and populations simultaneously, was performed. These different resampling strategies produced errors of the estimates, empiric probability distributions and confidence intervals for the following parameters: total fixation index (F ), diversity among populations or coancestry index (θ ), fixation index within populations (ƒ ), apparent outcrossing rates (ta), gene flow between populations (Nm), and effective population size (Ne ). Generally, smaller variances were associated with estimates of θ , whereas the largest were associated with F̂, ̂, and N̂m. The only estimates approaching normality were F, ƒ, when individuals were involved in the resampling process. This was probably caused by the larger number of individuals comparison with the number of loci and populations commonly used. Resampling both simulated and real datasets for estimation of , ƒ and θ jointly and separately showed that the variances due to individuals and due to populations are additive. Consequently, it is possible to calculate the relative contribution of these two sources of variation to the total variance of the estimates. There was overall agreement between results chained when two different methods were applied to assess the relative importance of individuals and populations as source of errors in the estimation of F , ƒ and θ. Bootstrap samples of variable sizes were used to determine the number of loci, individuals and populations necessary to achieve a given precision in the estimates of F, ƒ and θ. Variance estimates with different numbers of loci, individuals and population were obtained and regression analyses performed relating these estimates with the corresponding number of populations, individuals on loci. The magnitude of errors of the estimates in most real datasets indicated that sample sizes currently used in research involving natural populations would be suitable only for the estimation of θ. The largest errors of the estimates of F and ƒ were associated with sampling error due to loci. Therefore, future studies should use a larger number of loci to improve the estimation of these parameters. Sampling error due to populations was also important and should not be neglected for the estimation of F and ƒ. This study reinforced the importance of bootstrapping as a technique to measure precision of population parameter estimates under different sources of variatio

    Factorial analysis of bootstrap variances of population genetic parameter estimates

    No full text
    We presented an alternative way to verify the relative contribution to the total variance, of the sources of variation due to populations (P), individuals within populations (I), the (P*I) interaction, and the standard error of the following parameter estimates: total (F) and intrapopulation (f) fixation indices, and divergence among populations (q). The knowledge of this relative contribution is important to establish sampling strategies of natural populations. To attain these objectives, the bootstrap method was used to resample simultaneously populations and individuals, considering different combinations of P and I. This procedure was repeated five times for a given combination of each analyzed data set. For each data set, five estimates of these variances were obtained for each combination of P and I, and a given parameter estimate. These variance estimates were submitted to an analysis of variance, considering a factorial structure. The sources of variation considered in this analysis were P, I and P*I. The coefficient of determination (R²) was calculated for each source of variation. Sources of variation with greater R² are responsible for bigger errors of the estimates. The method applied was efficient for answering the questions initially proposed, and the results indicated that there are no ideal sample sizes for a species, but rather for a specific data set, because each data set has its own particularities. However, for investigations on the genetic structure of natural populations using population parameters, the number of populations to be sampled is a critical factor. Thus, more efforts should be made to increase the number of sampled populations, rather than the number of individuals within populations. A sampling strategy is given as a guide for investigations of this kind, when there is no previous knowledge about the genetic structure and the mating system of the populations

    Bootstrap method applied over resampling levels in the estimation of genetic parameters of populations

    Get PDF
    Submitted by Liliane Ferreira ([email protected]) on 2020-02-12T15:59:30Z No. of bitstreams: 2 Artigo - Luciana Aparecida Carlini Garcia - 2001.pdf: 163141 bytes, checksum: 1ab19ab14316d8d926178cd5e5b8ff84 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)Approved for entry into archive by Luciana Ferreira ([email protected]) on 2020-02-13T10:20:08Z (GMT) No. of bitstreams: 2 Artigo - Luciana Aparecida Carlini Garcia - 2001.pdf: 163141 bytes, checksum: 1ab19ab14316d8d926178cd5e5b8ff84 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)Made available in DSpace on 2020-02-13T10:20:08Z (GMT). No. of bitstreams: 2 Artigo - Luciana Aparecida Carlini Garcia - 2001.pdf: 163141 bytes, checksum: 1ab19ab14316d8d926178cd5e5b8ff84 (MD5) license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5) Previous issue date: 2001Marcadores isoenzimáticos ou moleculares têm sido empregados em estudos da estrutura genética e do sistema reprodutivo de populações naturais. Parâmetros genéticos populacionais de interesse são estimados, porém, há pouca informação sobre o erro associado a essas estimativas em função dos diferentes níveis de amostragem. Neste trabalho, o método de reamostragem bootstrap foi aplicado sobre locos, indivíduos, populações e indivíduos e populações concomitantemente, em dados de populações naturais. Para os parâmetros índice de fixação total (F ), índice de fixação intrapopulacional ( f ), diversidade entre populações (θ ) e taxa aparente de cruzamento ( ta ) foram obtidos, em função das fontes de reamostragem, os erros associados às estimativas desses parâmetros, a distribuição de empírica dessas estimativas e intervalos de confiança para tais parâmetros. Geralmente, os menores erros estão associados a , e verificou-se que apenas as distribuições empíricas de Fef e f tendem à normalidade quando indivíduos estão envolvidos na reamostragem. Foram feitas reamostragens com tamanho variável de amostras bootstrap, visando obter o número necessário de locos, indivíduos e populações para atingir um dado nível de precisão na estimação de F , f e θ . Em geral, os tamanhos amostrais utilizados nas pesquisas com populações naturais foram suficientes apenas para estimar θ , com a precisão estabelecida. A fonte de variação de locos foi responsável pelos maiores erros associados a Fef e f , sendo recomendável aumentar o número de locos em pesquisas dessa natureza. A amostragem de populações também deverá merecer atenção no planejamento de pesquisas futuras. Palavras-chave: estrutura populacional, genética de populações, estimaçãoGenetic structure and reproductive system of natural populations have often been studied using molecular markers and isozymes. Specific genetic parameters are therefore being estimated for this purpose. There is little information about errors associated with these estimates due to different possible sampling levels. Some real datasets were used in this study and bootstrapping was performed over loci, individuals, populations and both individuals and populations simultaneously. These different resampling strategies produced associated errors of the estimates and their empiric distributions and confidence intervals for the following parameters: total fixation index (F ), fixation index within populations ( f ), diversity between populations (θ ) and apparent outcrossing rate ( ta ). Generally, smaller errors were associated with . The only empirical distribution of estimates approaching normality were for Fandf and f when individuals were envolved in the resampling process. Bootstrap samples of variable sizes were used to obtain the number of loci, individuals and populations necessary to achieve a given precision of F,f , f and . Generally, the magnitude of errors of the estimates in most datasets indicated that sample sizes currently used in research involving natural populations were suitable only for the estimation of θ . The largest errors of Fandf and f , were associated to sampling errors due to loci. Therefore, future studies should use larger numbers of loci. Sampling errors due to population was also important and should not be neglected. Keywords: population structure, population genetics, estimatio

    Unraveling the genetic structure of Brazilian commercial sugarcane cultivars through microsatellite markers

    No full text
    <div><p>The Brazilian sugarcane industry plays an important role in the worldwide supply of sugar and ethanol. Investigation into the genetic structure of current commercial cultivars and comparisons to the main ancestor species allow sugarcane breeding programs to better manage crosses and germplasm banks as well as to promote its rational use. In the present study, the genetic structure of a group of Brazilian cultivars currently grown by commercial producers was assessed through microsatellite markers and contrasted with a group of basic germplasm mainly composed of <i>Saccharum officinarum</i> and <i>S</i>. <i>spontaneum</i> accessions. A total of 285 alleles was obtained by a set of 12 SSRs primer pairs that taken together were able to efficiently distinguish and capture the genetic variability of sugarcane commercial cultivars and basic germplasm accessions allowing its application in a fast and cost-effective way for routine cultivar identification and management of sugarcane germplasm banks. Allelic distribution revealed that 97.6% of the cultivar alleles were found in the basic germplasm while 42% of the basic germplasm alleles were absent in cultivars. Of the absent alleles, 3% was exclusive to <i>S</i>. <i>officinarum</i>, 33% to <i>S</i>. <i>spontaneum</i> and 19% to other species/exotic hybrids. We found strong genetic differentiation between the Brazilian commercial cultivars and the two main species (<i>S</i>. <i>officinarum</i>: = 0.211 and <i>S</i>. <i>spontaneum</i>: = 0.216, P<0.001), and significant contribution of the latter in the genetic variability of commercial cultivars. Average dissimilarity within cultivars was 1.2 and 1.4 times lower than that within <i>S</i>. <i>officinarum</i> and <i>S</i>. <i>spontaneum</i>. Genetic divergence found between cultivars and <i>S</i>. <i>spontaneum</i> accessions has practical applications for energy cane breeding programs as the choice of more divergent parents will maximize the frequency of transgressive individuals in the progeny.</p></div
    corecore