19 research outputs found
Aditividade de variâncias obtidas por bootstrap de estimativas de parâmetros genéticos populacionais
O estudo da estrutura genética de populações naturais é muito importante para a conservação e o uso da variabilidade genética disponÃvel na natureza. Esta pesquisa relaciona-se com a análise da estrutura genética de populações a partir de dados moleculares reais e simulados. Visando estimar variâncias de estimativas de parâmetros pertinentes, o método de reamostragem bootstrap foi aplicado levando em conta diferentes unidades amostrais, a saber: indivÃduos dentro de populações (I), populações (P) e indivÃduos e populações concomitantemente (I, P). Os parâmetros considerados foram: o Ãndice de fixação total (F ou F IT), o indice de fixação intrapopulacional (f ou F IS) e a divergência interpopulacional (teta ou F ST). O trabalho objetivou estimar a variância amostral das estimativas destes parâmetros para verificar se as variâncias de ;, ;e ;, obtidas pela reamostragem de indivÃduos e populações concomitantemente (I, P) são equivalentes à s obtidas pela soma (I+P) das variâncias estimadas reamostrando-se I e P separadamente. A equivalência foi verificada em todos os casos investigados, mostrando ser possÃvel estimar as variâncias das estimativas de ;, ;e ;, para cada fonte de variação (unidade amostral) somando-as depois para estimar a variância total. O procedimento facilita o uso do método bootstrap em dados com estrutura hierárquica e permite mensurar a importância relativa de cada fonte de variação sobre a variância amostral total das estimativas dos parâmetros.Studying the genetic structure of natural populations is very important for conservation and use of the genetic variability available in nature. This research is related to genetic population structure analysis using real and simulated molecular data. To obtain variance estimates of pertinent parameters, the bootstrap resampling procedure was applied over different sampling units, namely: individuals within populations (I), populations (P), and individuals and populations simultaneously (I, P). The considered parameters were: the total fixation index (F or F IT), the fixation index within populations (f or F IS) and the divergence among populations or intrapopulation coancestry (theta or F ST). The aim of this research was to verify if the variance estimates of ;, ;and ;, found through the resampling over individuals and populations simultaneously (I, P), correspond to the sum of the respective variance estimates obtained from separated resampling over individuals and populations (I+P). This equivalence was verified in all cases, showing that the total variance estimate of ;, ;and ;can be obtained summing up the variances estimated for each source of variation separately. Results also showed that this facilitates the use of the bootstrap method on data with hierarchical structure and opens the possibility of obtaining the relative contribution of each source of variation to the total variation of estimated parameters
Combining ability of inbred lines of maize and stability of their respective single-crosses
No melhoramento de milho (Zea mays L.), a utilização de cruzamentos dialélicos visando identificação de combinações superiores é uma prática comum. Esta metodologia visa estimar a capacidade de combinação dos materiais avaliados. Neste trabalho, cinco linhagens endogâmicas foram avaliadas quanto à s capacidades gerais (CGC) e especÃfica (CEC) de combinação, utilizando o esquema de dialelo completo. Os hÃbridos simples produzidos entre estas linhagens foram avaliados em sete ambientes, juntamente com duas testemunhas, tendo-se utilizado o delineamento de blocos casualizados. Avaliaram-se os caracteres: produção de grãos, altura da planta, altura da espiga, posição relativa da espiga e prolificidade. Realizou-se a análise dialélica, seguindo uma adaptação do método IV de Griffing, além das análises de estabilidade e adaptabilidade dos hÃbridos. Detectaram-se diferenças significativas para tratamentos e ambientes para todos os caracteres. A interação genótipos por ambientes foi significativa para maioria dos caracteres. As CGCs foram significativas para todos os caracteres, enquanto que a CEC foi não significativa apenas para posição relativa da espiga. Para o caráter produção de grãos, tanto os efeitos aditivos (CGC) quanto não aditivos (CEC) foram importantes, enquanto que para os demais caracteres, houve predominância dos efeitos aditivos. O hÃbrido mais produtivo foi obtido entre as linhagens L-08-05F e L-38-05D. Suas linhagens apresentaram elevadas CGCs e seu hÃbrido, elevada CEC, além de ter sido responsivo à melhoria das condições ambientais e razoavelmente estável. O segundo hÃbrido mais produtivo, L-46-10D x L-08-05F, mostrou ampla adaptabilidade e estabilidade.The utilization of diallel crosses for identification of superior combinations is a common practice in maize (Zea mays L.) breeding programs. This methodology allows the estimation of the combining ability of genotypes being evaluated. In this work, five inbred lines were evaluated as to their general (GCA) and specific (SCA) combining abilities, by using a complete diallel scheme. The single-crosses produced between these inbred lines were evaluated in seven environments, along with two checks, by using a randomized complete block design. Traits analized were: grain yield, plant height, ear height, ear placement, and prolificacy. A diallel analysis was carried out, following an adaptation of Griffing's method IV, in addition to hybrid stability and adaptability analyses. Significant differences were detected for entries and environments for all traits. The interaction genotype vs. environment was significant for all traits. GCA's were significant for all traits, while SCA's were non-significant only for ear placement. For grain yield, both additive (GCA) and non-additive (SCA) effects were important, while for the remaining traits additive effects were more important. The high yielding single-cross was obtained from the cross of lines L-08-05F and L-38-05D. Those inbred lines showed higher GCA's and their cross also had high SCA; also, it is responsive to environment improvements and reasonably stable. The second in rank high yielding single-cross, L-46-10D x L-08-05F, showed wide adaptability and stability
Use of Bootstrap in the estimation of population genetic parameters
Muitos autores têm utilizado marcadores isoenzimáticos ou moleculares para estudar a estrutura genética e o sistema reprodutivo de populações naturais. Para tanto, parâmetros populacionais de interesse são estimados, mas há pouca informação sobre o erro associado a essas estimativas em função dos diferentes nÃveis de amostragem. Através dessa informação, estratégias de amostragem poderiam ser estabelecidas de modo a reduzir a magnitude dos erros associados a tais estimativas. No presente trabalho foram utilizados conjuntos de dados reais, além de dados simulados em algumas situações. Para os dados reais, foram feitas reamostragens bootstrap de locos, indivÃduos, populações, e indivÃduos e populações concomitantemente. Para os parâmetros Ãndice de fixação total (F), diversidade entre populações ou grau de coancestralidade nas populações (θ), Ãndice de fixação dentro das populações (ƒ), taxa aparente de cruzamento (ta), fluxo de genes entre populações (Nm) e tamanho efetivo populacional (Ne) foi possÃvel obter, em função das diferentes fontes de reamostragem, os erros associados à s estimativas desses parâmetros, a distribuição empÃrica dessas estimativas e intervalos de confiança para tais parâmetros. Em geral, as menores variâncias estão associadas à s estimativas de θ. O contrário foi observado para F, ƒ e Nm. Verificou-se que apenas as distribuições empÃricas de F̂ e f̂; tendem à normalidade. Isso ocorreu somente quando foram feitas reamostragens envolvendo indivÃduos, possivelmente por serem mais numerosos que populações e locos. A partir dos dados reais e simulados, para os parâmetros F, ƒ e θ individualmente e em conjunto, verificou-se que as estimativas das variâncias devidas à reamostragem de indivÃduos e de populações isoladamente são aditivas. Consequentemente, pode-se calcular a contribuição relativa destas duas fontes de variação para a variância total das estimativas. Foi possÃvel concluir que dois métodos de verificação da importância relativa das causas de variação de populações e de indivÃduos, como fonte de erros das estimativas dos parâmetros F, ƒ e θ, em geral, apresentaram resultados concordantes. Para obter o número necessário de locos, indivÃduos e populações, visando atingir uma determinada precisão na estimação de F, ƒ e θ, foram feitas reamostragens com tamanho variável de amostras bootstrap. Para os diversos nÃveis dos fatores locos, indivÃduos e populações, foram estimadas as respectivas variâncias e construÃdas curvas de regressão entre o número de populações, ou indivÃduos ou locos e os erros de estimação associados. Em geral, os tamanhos amostrais utilizados nas pesquisas com populações naturais foram suficientes apenas para estimar θ, considerando a magnitude estabelecida para os erros das estimativas. Observou-se também que a fonte de variação de locos foi responsável pelos maiores erros das estimativas dos parâmetros F e ƒ. Portanto, em pesquisas futuras dessa natureza, é recomendável atentar para a necessidade de trabalhar com número adequado de locos. Este número certamente deve ser maior do que o comumente utilizado. A fonte de variação de populações também foi importante na estimação dos parâmetros F e θ, devendo assim merecer a devida atenção. Diante dessas informações, evidencia-se a importância da aplicação de bootstrap na mensuração da precisão de estimativas de parâmetros populacionais, em função das diversas fontes de variaçãoGenetic structure and mating system of natural populations have often been studied using molecular markers and isozymes. Specific genetic parameters are therefore being estimated for this purpose. There is little information about errors associated with these estimates due to different possible sampling leveis. The knowledge of this information could be used to minimize the magnitude of the errors associated with such estimates. Real and simulated datasets were used in this study. With the real datasets, bootstrapping over loci, individuals, populations and both individuals and populations simultaneously, was performed. These different resampling strategies produced errors of the estimates, empiric probability distributions and confidence intervals for the following parameters: total fixation index (F ), diversity among populations or coancestry index (θ ), fixation index within populations (ƒ ), apparent outcrossing rates (ta), gene flow between populations (Nm), and effective population size (Ne ). Generally, smaller variances were associated with estimates of θ , whereas the largest were associated with F̂, ̂, and N̂m. The only estimates approaching normality were F, ƒ, when individuals were involved in the resampling process. This was probably caused by the larger number of individuals comparison with the number of loci and populations commonly used. Resampling both simulated and real datasets for estimation of , ƒ and θ jointly and separately showed that the variances due to individuals and due to populations are additive. Consequently, it is possible to calculate the relative contribution of these two sources of variation to the total variance of the estimates. There was overall agreement between results chained when two different methods were applied to assess the relative importance of individuals and populations as source of errors in the estimation of F , ƒ and θ. Bootstrap samples of variable sizes were used to determine the number of loci, individuals and populations necessary to achieve a given precision in the estimates of F, ƒ and θ. Variance estimates with different numbers of loci, individuals and population were obtained and regression analyses performed relating these estimates with the corresponding number of populations, individuals on loci. The magnitude of errors of the estimates in most real datasets indicated that sample sizes currently used in research involving natural populations would be suitable only for the estimation of θ. The largest errors of the estimates of F and ƒ were associated with sampling error due to loci. Therefore, future studies should use a larger number of loci to improve the estimation of these parameters. Sampling error due to populations was also important and should not be neglected for the estimation of F and ƒ. This study reinforced the importance of bootstrapping as a technique to measure precision of population parameter estimates under different sources of variatio
Use of Bootstrap in the estimation of population genetic parameters
Muitos autores têm utilizado marcadores isoenzimáticos ou moleculares para estudar a estrutura genética e o sistema reprodutivo de populações naturais. Para tanto, parâmetros populacionais de interesse são estimados, mas há pouca informação sobre o erro associado a essas estimativas em função dos diferentes nÃveis de amostragem. Através dessa informação, estratégias de amostragem poderiam ser estabelecidas de modo a reduzir a magnitude dos erros associados a tais estimativas. No presente trabalho foram utilizados conjuntos de dados reais, além de dados simulados em algumas situações. Para os dados reais, foram feitas reamostragens bootstrap de locos, indivÃduos, populações, e indivÃduos e populações concomitantemente. Para os parâmetros Ãndice de fixação total (F), diversidade entre populações ou grau de coancestralidade nas populações (θ), Ãndice de fixação dentro das populações (ƒ), taxa aparente de cruzamento (ta), fluxo de genes entre populações (Nm) e tamanho efetivo populacional (Ne) foi possÃvel obter, em função das diferentes fontes de reamostragem, os erros associados à s estimativas desses parâmetros, a distribuição empÃrica dessas estimativas e intervalos de confiança para tais parâmetros. Em geral, as menores variâncias estão associadas à s estimativas de θ. O contrário foi observado para F, ƒ e Nm. Verificou-se que apenas as distribuições empÃricas de F̂ e f̂; tendem à normalidade. Isso ocorreu somente quando foram feitas reamostragens envolvendo indivÃduos, possivelmente por serem mais numerosos que populações e locos. A partir dos dados reais e simulados, para os parâmetros F, ƒ e θ individualmente e em conjunto, verificou-se que as estimativas das variâncias devidas à reamostragem de indivÃduos e de populações isoladamente são aditivas. Consequentemente, pode-se calcular a contribuição relativa destas duas fontes de variação para a variância total das estimativas. Foi possÃvel concluir que dois métodos de verificação da importância relativa das causas de variação de populações e de indivÃduos, como fonte de erros das estimativas dos parâmetros F, ƒ e θ, em geral, apresentaram resultados concordantes. Para obter o número necessário de locos, indivÃduos e populações, visando atingir uma determinada precisão na estimação de F, ƒ e θ, foram feitas reamostragens com tamanho variável de amostras bootstrap. Para os diversos nÃveis dos fatores locos, indivÃduos e populações, foram estimadas as respectivas variâncias e construÃdas curvas de regressão entre o número de populações, ou indivÃduos ou locos e os erros de estimação associados. Em geral, os tamanhos amostrais utilizados nas pesquisas com populações naturais foram suficientes apenas para estimar θ, considerando a magnitude estabelecida para os erros das estimativas. Observou-se também que a fonte de variação de locos foi responsável pelos maiores erros das estimativas dos parâmetros F e ƒ. Portanto, em pesquisas futuras dessa natureza, é recomendável atentar para a necessidade de trabalhar com número adequado de locos. Este número certamente deve ser maior do que o comumente utilizado. A fonte de variação de populações também foi importante na estimação dos parâmetros F e θ, devendo assim merecer a devida atenção. Diante dessas informações, evidencia-se a importância da aplicação de bootstrap na mensuração da precisão de estimativas de parâmetros populacionais, em função das diversas fontes de variaçãoGenetic structure and mating system of natural populations have often been studied using molecular markers and isozymes. Specific genetic parameters are therefore being estimated for this purpose. There is little information about errors associated with these estimates due to different possible sampling leveis. The knowledge of this information could be used to minimize the magnitude of the errors associated with such estimates. Real and simulated datasets were used in this study. With the real datasets, bootstrapping over loci, individuals, populations and both individuals and populations simultaneously, was performed. These different resampling strategies produced errors of the estimates, empiric probability distributions and confidence intervals for the following parameters: total fixation index (F ), diversity among populations or coancestry index (θ ), fixation index within populations (ƒ ), apparent outcrossing rates (ta), gene flow between populations (Nm), and effective population size (Ne ). Generally, smaller variances were associated with estimates of θ , whereas the largest were associated with F̂, ̂, and N̂m. The only estimates approaching normality were F, ƒ, when individuals were involved in the resampling process. This was probably caused by the larger number of individuals comparison with the number of loci and populations commonly used. Resampling both simulated and real datasets for estimation of , ƒ and θ jointly and separately showed that the variances due to individuals and due to populations are additive. Consequently, it is possible to calculate the relative contribution of these two sources of variation to the total variance of the estimates. There was overall agreement between results chained when two different methods were applied to assess the relative importance of individuals and populations as source of errors in the estimation of F , ƒ and θ. Bootstrap samples of variable sizes were used to determine the number of loci, individuals and populations necessary to achieve a given precision in the estimates of F, ƒ and θ. Variance estimates with different numbers of loci, individuals and population were obtained and regression analyses performed relating these estimates with the corresponding number of populations, individuals on loci. The magnitude of errors of the estimates in most real datasets indicated that sample sizes currently used in research involving natural populations would be suitable only for the estimation of θ. The largest errors of the estimates of F and ƒ were associated with sampling error due to loci. Therefore, future studies should use a larger number of loci to improve the estimation of these parameters. Sampling error due to populations was also important and should not be neglected for the estimation of F and ƒ. This study reinforced the importance of bootstrapping as a technique to measure precision of population parameter estimates under different sources of variatio
Bootstrap method applied over resampling levels in the estimation of genetic parameters of populations
Submitted by Liliane Ferreira ([email protected]) on 2020-02-12T15:59:30Z
No. of bitstreams: 2
Artigo - Luciana Aparecida Carlini Garcia - 2001.pdf: 163141 bytes, checksum: 1ab19ab14316d8d926178cd5e5b8ff84 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)Approved for entry into archive by Luciana Ferreira ([email protected]) on 2020-02-13T10:20:08Z (GMT) No. of bitstreams: 2
Artigo - Luciana Aparecida Carlini Garcia - 2001.pdf: 163141 bytes, checksum: 1ab19ab14316d8d926178cd5e5b8ff84 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)Made available in DSpace on 2020-02-13T10:20:08Z (GMT). No. of bitstreams: 2
Artigo - Luciana Aparecida Carlini Garcia - 2001.pdf: 163141 bytes, checksum: 1ab19ab14316d8d926178cd5e5b8ff84 (MD5)
license_rdf: 0 bytes, checksum: d41d8cd98f00b204e9800998ecf8427e (MD5)
Previous issue date: 2001Marcadores isoenzimáticos ou moleculares têm sido empregados em estudos da estrutura genética
e do sistema reprodutivo de populações naturais. Parâmetros genéticos populacionais de interesse são
estimados, porém, há pouca informação sobre o erro associado a essas estimativas em função dos diferentes
nÃveis de amostragem. Neste trabalho, o método de reamostragem bootstrap foi aplicado sobre locos,
indivÃduos, populações e indivÃduos e populações concomitantemente, em dados de populações naturais.
Para os parâmetros Ãndice de fixação total (F ), Ãndice de fixação intrapopulacional ( f ), diversidade entre
populações (θ ) e taxa aparente de cruzamento ( ta ) foram obtidos, em função das fontes de reamostragem,
os erros associados à s estimativas desses parâmetros, a distribuição de empÃrica dessas estimativas e intervalos
de confiança para tais parâmetros. Geralmente, os menores erros estão associados a , e verificou-se que
apenas as distribuições empÃricas de F tendem à normalidade quando indivÃduos estão envolvidos na
reamostragem. Foram feitas reamostragens com tamanho variável de amostras bootstrap, visando obter o
número necessário de locos, indivÃduos e populações para atingir um dado nÃvel de precisão na estimação de
F , f e θ . Em geral, os tamanhos amostrais utilizados nas pesquisas com populações naturais foram suficientes
apenas para estimar θ , com a precisão estabelecida. A fonte de variação de locos foi responsável pelos
maiores erros associados a F , sendo recomendável aumentar o número de locos em pesquisas dessa
natureza. A amostragem de populações também deverá merecer atenção no planejamento de pesquisas futuras.
Palavras-chave: estrutura populacional, genética de populações, estimaçãoGenetic structure and reproductive system of natural populations have often been studied using
molecular markers and isozymes. Specific genetic parameters are therefore being estimated for this purpose.
There is little information about errors associated with these estimates due to different possible sampling
levels. Some real datasets were used in this study and bootstrapping was performed over loci, individuals,
populations and both individuals and populations simultaneously. These different resampling strategies
produced associated errors of the estimates and their empiric distributions and confidence intervals for the
following parameters: total fixation index (F ), fixation index within populations ( f ), diversity between populations
(θ ) and apparent outcrossing rate ( ta ). Generally, smaller errors were associated with . The only empirical
distribution of estimates approaching normality were for F when individuals were envolved in the
resampling process. Bootstrap samples of variable sizes were used to obtain the number of loci, individuals
and populations necessary to achieve a given precision of F and . Generally, the magnitude of errors of
the estimates in most datasets indicated that sample sizes currently used in research involving natural
populations were suitable only for the estimation of θ . The largest errors of F , were associated to
sampling errors due to loci. Therefore, future studies should use larger numbers of loci. Sampling errors due
to population was also important and should not be neglected.
Keywords: population structure, population genetics, estimatio
Factorial analysis of bootstrap variances of population genetic parameter estimates
We presented an alternative way to verify the relative contribution to the total variance, of the sources of variation due to populations (P), individuals within populations (I), the (P*I) interaction, and the standard error of the following parameter estimates: total (F) and intrapopulation (f) fixation indices, and divergence among populations (q). The knowledge of this relative contribution is important to establish sampling strategies of natural populations. To attain these objectives, the bootstrap method was used to resample simultaneously populations and individuals, considering different combinations of P and I. This procedure was repeated five times for a given combination of each analyzed data set. For each data set, five estimates of these variances were obtained for each combination of P and I, and a given parameter estimate. These variance estimates were submitted to an analysis of variance, considering a factorial structure. The sources of variation considered in this analysis were P, I and P*I. The coefficient of determination (R²) was calculated for each source of variation. Sources of variation with greater R² are responsible for bigger errors of the estimates. The method applied was efficient for answering the questions initially proposed, and the results indicated that there are no ideal sample sizes for a species, but rather for a specific data set, because each data set has its own particularities. However, for investigations on the genetic structure of natural populations using population parameters, the number of populations to be sampled is a critical factor. Thus, more efforts should be made to increase the number of sampled populations, rather than the number of individuals within populations. A sampling strategy is given as a guide for investigations of this kind, when there is no previous knowledge about the genetic structure and the mating system of the populations