16 research outputs found

    Projeto Genográfico e as implicações da popularização dos estudos de Genealogia Gênica

    Get PDF
    The Genographic Project seeks to characterize the genetic variation of the global human population, based mainly on genetic data from isolated indigenous groups and, on a smaller scale, on the voluntary participation of individuals interested in understanding their origins. However, the implications of this knowledge deserve careful consideration, and it is also important to evaluate the degree of illusion that is being created among laymen who seek knowledge about their genetic ancestry.O Projeto Genográfico busca caracterizar a variabilidade genética da população mundial, baseando-se majoritariamente em dados genéticos de grupos indígenas isolados e, em menor escala, na participação voluntária de indivíduos interessados em entender suas origens. No entanto, as implicações deste conhecimento merecem ressalva, assim como é importante avaliar o grau de ilusão que está sendo gerado entre os leigos que buscam conhecer sua ancestralidade genética

    Intercruzamento de humanos modernos com neanderthais: novas perspectivas à luz da genética

    Get PDF
    Some fossil analyses have found osteological similarities between modern humans and Neanderthals that suggest that there was interbreeding between the two species. If, however, we accept the recent African replacement hypothesis, under which modern humans replaced Neanderthals in Europe without interbreeding of the two groups, then these traits could belong to a common ancestor of the two species or maybe could represent an example of convergent evolution. Over a decade of mitochondrial DNA studies, it has been established that, for this molecule, modern humans and Neanderthals are clearly separate genetic lineages, without signs of interbreeding. The recent finding that modern humans and Neanderthals share significant portions of their nuclear DNA, however, raises new questions about the Out-of-Africa hypothesis and about what makes us modern humans.Algumas análises fósseis encontraram características osteológicas em ambos – humanos modernos e neandertais – que sugerem intercruzamento das duas espécies. Se, contudo, for aceita a teoria da origem africana, segundo a qual humanos modernos substituíram os neandertais na Europa, sem intercruzamento dos dois grupos, então essas características podem pertencer a um ancestral comum das duas espécies ou mesmo ser um exemplo de evolução convergente. Mais de uma década de estudos do DNA mitocondrial estabeleceram que, para essa molécula, humanos modernos e neandertais são claramente linhagens genéticas separadas, sem sinais de miscigenação. A recente descoberta de que humanos modernos e neandertais compartilham porções significativas de seus genomas nucleares, entretanto, acende novas questões sobre a hipótese de origem africana e sobre o que nos faz humanos modernos

    Inferring Balancing Selection From Genome-Scale Data

    Get PDF
    The identification of genomic regions and genes that have evolved under natural selection is a fundamental objective in the field of evolutionary genetics. While various approaches have been established for the detection of targets of positive selection, methods for identifying targets of balancing selection, a form of natural selection that preserves genetic and phenotypic diversity within populations, have yet to be fully developed. Despite this, balancing selection is increasingly acknowledged as a significant driver of diversity within populations, and the identification of its signatures in genomes is essential for understanding its role in evolution. In recent years, a plethora of sophisticated methods has been developed for the detection of patterns of linked variation produced by balancing selection, such as high levels of polymorphism, altered allele-frequency distributions, and polymorphism sharing across divergent populations. In this review, we provide a comprehensive overview of classical and contemporary methods, offer guidance on the choice of appropriate methods, and discuss the importance of avoiding artifacts and of considering alternative evolutionary processes. The increasing availability of genome-scale datasets holds the potential to assist in the identification of new targets and the quantification of the prevalence of balancing selection, thus enhancing our understanding of its role in natural populations

    Genome-wide analysis identifies genetic effects on reproductive success and ongoing natural selection at the FADS locus

    Get PDF
    : Identifying genetic determinants of reproductive success may highlight mechanisms underlying fertility and identify alleles under present-day selection. Using data in 785,604 individuals of European ancestry, we identified 43 genomic loci associated with either number of children ever born (NEB) or childlessness. These loci span diverse aspects of reproductive biology, including puberty timing, age at first birth, sex hormone regulation, endometriosis and age at menopause. Missense variants in ARHGAP27 were associated with higher NEB but shorter reproductive lifespan, suggesting a trade-off at this locus between reproductive ageing and intensity. Other genes implicated by coding variants include PIK3IP1, ZFP82 and LRP4, and our results suggest a new role for the melanocortin 1 receptor (MC1R) in reproductive biology. As NEB is one component of evolutionary fitness, our identified associations indicate loci under present-day natural selection. Integration with data from historical selection scans highlighted an allele in the FADS1/2 gene locus that has been under selection for thousands of years and remains so today. Collectively, our findings demonstrate that a broad range of biological mechanisms contribute to reproductive success

    Natural selection on HLA genes: a molecular investigation of the location and timing of selection events

    No full text
    A comparação de taxas de substituição não-sinônimas (dN) e sinônimas (dS) permite inferir quais regimes de seleção operaram sobre regiões codificadoras. Genes com d>N/dS > 1 são candidatos a estarem sob seleção positiva, e scans genômicos em busca dessa assinatura se revelaram uma ferramenta poderosa. Trata-se de um método robusto, uma vez que assume-se que tais sítios estão intercalados nas regiões do genoma sob estudo (e portanto partilham a mesma história demográfica), e que têm como foco a variação em genes específicos, eliminando ambiguidades acerca do alvo da seleção. Por outro lado, o critério de ω > 1 para que genes estejam sob seleção positiva é muito conservador. Isso ocorre porque geralmente apenas alguns códons estão sob seleção positiva, enquanto a maior parte das mutações não-sinônimas são deletérias e, portanto, estão sob seleção purificadora. Por isso, convencionou-se analisar subconjuntos de códons em busca de seleção, seja através de uma base de dados mais restrita ou através de modelos que estimam diferentes valores de ω para subconjuntos de códons, tornando possível inferir quais deles estão sob seleção positiva. Os genes das moléculas MHC têm vários padrões de variação que indicam que algum tipo de seleção balanceadora atuou sobre eles (alta diversidade, grande diferenciação entre alelos e a existência de polimorfismos trans-específicos). Os genes HLA constituem um subconjunto de genes do MHC humano e estão localizados no braço curto do cromossomo 6. Os genes clássicos de classe I (HLA-A, HLA-B e HLA-C) são expressos na maior parte das células somáticas e desempenham papel central no processo de resposta imune adaptativa, capturando e apresentando peptídeos na superfície celular. A região da molécula de MHC à qual antígenos são ligados para serem apresentados a linfócitos T, dessa forma iniciando a resposta imune adaptativa, é conhecida como sítio de reconhecimento do antígeno (ARS). É bem estabelecido que os códons ARS apresentam taxas de substituição não-sinônimas maiores que as taxas sinônimas para esses três locos, consistente com um efeito de seleção balanceadora levando a maior variabilidade funcional na região da molécula que interage com o peptídeo. Os genes HLA clássicos apresentam centenas de alelos, e esses constituem clados que reúnem alelos filogeneticamente relacionados e com similaridades funcionais. Apesar de não haver controvérsia sobre a existência de seleção sobre genes HLA, não existe consenso acerca da importância relativa da seleção sobre linhagens alélicas e sobre alelos individuais na diversificação dos alelos de HLA, e essa foi a questão que decidimos investigar. Nossa hipótese nula foi a de que as linhagens foram os alvos da seleção e a hipótese alternativa foi a de que os alelos individuais foram alvos da seleção ao longo da história evolutiva dos genes HLA. Buscamos, primeiramente, fazer uma validação do método de inferência de dN/dS usando como estudo de caso os códons ARS e sua relação com a capacidade de inferência. Constatamos que, dos códons que encontramos sob seleção positiva, todos (exceto um) estão também na classificação clássica dos códons ARS ou a ±1 códon de distância destes, mostrando que existem evidências de seleção em sítios vizinhos aos ARS. Portanto, uma classificação expandida, que inclua os códons sob seleção que não estão nas classificações ARS comumente utilizadas, deveria aumentar o poder estatístico de testes de modelos de seleção nos genes HLA. Ao comparar os resultados obtidos em análises filogenéticas com bases de dados com e sem recombinantes, verificamos que a remoção de alelos recombinantes altera as estimativas de parâmetros, a identificação de códons com evidência de seleção e a significância dos testes de comparação de modelos. Nossas análises mostraram que ω é significativamente maior para pares de alelos de linhagens diferentes do que para pares de alelos de uma mesma linhagem e que existe uma correlação positiva significativa entre o tempo de divergência dos alelos e as estimativas de ω. Verificamos, ainda, que é possível rejeitar um modelo nulo de uma razão ω estimada para todos os ramos da árvore filogenética e favorecer um modelo em que ω é estimado separadamente para ramos entre e intra-linhagens em HLA-C. Em HLA-A e HLA-C, ω é significativamente > 1 entre linhagens. Mostramos também, para os mesmos locos, ω é significativamente > 1 nos ramos internos. Em HLA-C, o modelo que estima ω separadamente para ramos internos e terminais foi favorecido. Nossos resultados mostram que a intensidade de seleção atuando entre linhagens é maior do que aquela dentro de linhagens. Entretanto, mesmo dentro de linhagens, há fortes evidências de desvios de neutralidade, sugerindo a ação da seleção natural.The comparison of non-synonymous (dN) and synonymous (dS) substitution rates allows us to infer selection schemes which operated in coding regions. Genes with dN/dS > 1 are candidates to be under positive selection, and genome scans in search for this signature have proved to be a powerful tool. It is a robust method, since it is assumed that such sites are interspersed in regions of the genome under study (and therefore share the same demographic history), and which focuses on the variation in specific genes, eliminating ambiguities about the target of selection. On the other hand, the criterion of ω > 1 for genes to be considered under positive selection is very conservative. This is because usually only a few codons are under positive selection, while most non-synonymous mutations are deleterious and are thus under purifying selection. Therefore, it has been conventioned to analyze subsets of codons in search of selection, either through a narrower data set or through models that calculate different ω values for subsets of codons, making it possible to infer which of them are under positive selection. The MHC molecules genes have different variation patterns that indicate some sort of balancing selection acted upon them (high diversity, large differentiation between alleles and the existence of trans-specific polymorphisms). HLA genes are a subset of human MHC genes and are located on the short arm of chromosome 6. The classical class I genes (HLA-A, HLA-B and HLA-C) are expressed in most somatic cells and play a central role in the process of adaptive immune response, capturing and presenting peptides on the cell surface. The region of the MHC molecule to which antigens are bound to be presented to T lymphocytes, thereby initiating the adaptive immune response, is known as the antigen recognition site (ARS). It is well established that ARS codons have higher non-synonymous than synonymous substitution rates on these three loci, consistent with an effect of balancing selection leading to greater variability in the functional region of the molecule that interacts with the peptide. The classical HLA genes have hundreds of alleles, and these constitute clades which group phylogenetically related and functionally similar alleles. Although there is no controversy about the existence of selection acting on HLA genes, there is no consensus on the relative importance of selection on allelic lineages and on individual alleles on the diversification of HLA alleles, and that was the question we decided to investigate. Our null hypothesis was that lineages were targets of selection and the alternative hypothesis was that the individual alleles were targets of selection during the evolutionary history of HLA genes. We sought, first, to make a validation of the method of inference dN/d>S using as a case study the ARS codons and their relation to the ability of inference. Of all the codons under selection we found, all (except one) are also in the classification of classical ARS codons or ±1 codon away from these, showing that there is evidence of selection at nearby sites to the ARS. Therefore, an expanded classification, which includes the codons under selection that are not commonly used in the ARS classifications, should increase the statistical power of selecion model tests on the HLA genes. By comparing the results obtained in phylogenetic analysis using data sets with or without recombinants, we found that the removal of recombinant alleles alters the parameter estimates, the identification of codons with evidence of selection and the significance of model comparison tests. Our analysis showed that ω is significantly higher for pairs of alleles from different lineages than for pairs of alleles from the same lineage and that there is a significant positive correlation between time of divergence of alleles and estimates of ω. We also verified that it is possible to reject a null model of one ω estimated for all branches of the phylogenetic tree and favor a model where ω is estimated separately for branches within and between lineages of HLA-C. In HLA-A and HLA-C, ω is significantly > 1 between lineages. We also show that, for these same loci, ω fis significantly greater than one or internal branches. In HLA-C, the model that estimates ω separately for terminal and internal branches was favored. Our results show that the intensity of selection between lineages is greater then within them. However, even within lineages, there is a strong evidence of deviation from neutrality, suggesting the action of natural selection

    Balancing selection in the human genome: biological relevance and deleterious consequence

    No full text
    Seleção balanceadora é um processo evolutivo que engloba diversos mecanismos: vantagem do heterozigoto, seleção dependente de frequência, pressões seletivas que variam ao longo do tempo ou do espaço, e alguns casos de pleiotropia. O estudo desses mecanismos em si foi e ainda é um tópico de grande interesse para os biólogos evolutivos, e moldou o estudo da evolução ao longo do último século. Antes de a teoria neutra ter sido proposta, acreditava-se que a seleção balanceadora fosse comum. A descoberta de que muita da diversidade genética observada podia ser explicada por evolução neutra motivou, portanto, uma melhor compreensão da seleção balanceadora como um regime seletivo capaz de manter variantes vantajosas nas populações. O estudo da seleção balanceadora, em seus primórdios, foi restrito a organismos que podiam ser manipulados em laboratório. Com o advento de métodos que permitiam quantificar a variabilidade genética - tais como a eletroforese de proteínas, sequenciamento em pequena escala e re-sequenciamento genômico de milhares de indivíduos -, a variabilidade genética humana passou a ser ativamente estudada e interpretada. Diversos estudos buscaram por assinaturas de seleção natural - i.e., padrões de variação genômica deixadas por tais regimes seletivos - e avaliaram seu significado comparando-as com o que seria esperado sob um cenário estritamente neutro. A maior parte desses esforços foram concentrados no estudo da seleção positiva, tida como o principal mecanismo responsável pela evolução adaptativa. Poucos estudos buscaram assinaturas de seleção balanceadora no genoma humano. Isso se deve em parte à escassez de métodos com alto poder para detectar tais assinaturas. Adicionalmente, estudos prévios não analisaram dados em escala genômica, ou se concentraram principalmente nas regiões codificadoras de proteínas. Aqui, nós descrevemos um método simples e com alto poder para detectar assinaturas de seleção balanceadora. Em humanos, esse método supera outros comumente usados para a detecção de tais assinaturas e, em teoria, poderia ser usado para detectá-las em outras espécies, desde que seu poder seja avaliado caso-a-caso através de simulações neutras. Nosso método (\"Non-Central Deviation\", NCD) é apresentado em duas versões: NCD2, que requer informação acerca dos polimorfismos da espécie analisada e das substituições entre essa espécie e um grupo externo, e NCD1, que requer apenas informação acerca dos polimorfismos da espécie analisada. Embora em humanos NCD2 supere NCD1, este último pode ser utilizado para espécies para as quais não haja informação de um grupo externo. Quando aplicamos NCD2 a dados humanos, usando chimpanzé como grupo ex- terno, encontramos mais de 200 genes codificadores de proteínas com forte assinatura de seleção balanceadora, dos quais apenas 1/3 tinha evidência prévia de seleção balanceadora. Encontramos também um enriquecimento para diversas categorias de ontologia gênica, das quais cerca da metade é relacionada à imunidade. Verificamos que dentre os genes com evidências de seleção balanceadora há um excesso de casos de expressão preferencial em tecidos tais como \"adrenal\" e \"pulmão\", e também um excesso de genes com expressão mono-alélica. No geral, vimos que as regiões selecionadas no genoma humano incluem tanto sítios codificadores quanto regulatórios. Não encontramos um excesso de assinaturas de seleção balanceadora em regiões regulatórias, ao contrário do que reportaram outros estudos. Finalmente, encontramos um excesso de polimorfismos não-sinônimos em relação aos sinônimos nos genes selecionados. Tendo documentado a ocorrência de seleção balanceadora no genoma humano e identificado genes que foram potencialmente alvos deste regime seletivo, nós investi- gamos as consequências evolutivas desse processo. Nós partimos da hipótese que a seleção balanceadora sobre um sítio reduz a eficiência com a qual a seleção purificadora elimina variantes deletérias em sítios vizinhos. Esse processo é uma consequência do quanto a seleção sobre um loco afeta, através de ligação genética, as frequências de sítios não-neutros adjacentes. Testamos essa hipótese examinando se os genes sob seleção balanceadora apresentam um excesso de variantes deletérias em relação a expectativas derivadas a partir do restante do genoma. Usando três diferentes métricas para determinadas se e/ou o quão deletéria é uma dada variante, identificamos um excesso de variantes deletérias dentro dos genes sob seleção balanceadora, e mostramos que tal padrão não pode ser atribuído a efeitos confundidores. Esse achado mostra que, juntamente com os benefícios associados à variação adaptativa, a seleção balanceadora aumenta o fardo de mutações deletérias no genoma humano. De forma geral, nossos achados sugerem que a seleção balanceadora provavelmente mantém variantes genéticas envolvidas em uma miríade de processos biológicos além da imunidade e que ela foi mais comum no genoma humano do que se acreditava anteriormente, afetando entre 1-8% dos genes codificadores de proteínas, bem como diversas regiões não-codificadoras. Adicionalmente, a seleção balanceadora parece ser importante para a evolução humana não apenas por seu efeito sobre a aptidão, mas também por ter sido uma importante força capaz de moldar a diversidade genética observada atualmente em humanos e a susceptibilidade a doençasBalancing selection is an evolutionary process that encompasses several mechanisms: heterozygote advantage, negative frequency dependent selection, selective pressure that fluctuates in time or in space, and some cases of pleiotropy. The study of these mechanisms .per se has been and still is a topic of great interest for evolutionary biologists, and has shaped the study of evolution throughout the last century. Before the proposition of the neutral theory of molecular evolution, it was believed that balancing selection was pervasive. The realization that much of the observed genetic diversity could be explained by neutral evolution thus motivated a better understanding of balancing selection as a selective regime capable of maintaining adaptive variants in populations. The study of balancing selection, in its early stages, was restricted to organisms that could be manipulated in the laboratory. With the advent of methods that allowed quantification of genetic variation - such as protein electrophoresis, small scale sequencing and genome-wide re-sequencing of thousands of individuals - human variation started to be actively studied and interpreted. Several studies have looked for signatures of natural selection - i.e., patterns of genomic variation that selective regimes leave in the genome - and evaluated their significance by comparing them to what would be expected under a strictly neutral scenario. Most of these efforts focused on the study of positive selection, thought of as the prime mechanism responsible for adaptive evolution. Only a few studies looked for signatures of balancing selection in the human genome. This is partially due to the paucity of powerful methods to detect its signatures. Moreover, previous studies either did not analyze data on genomic scale or focused primarily on protein-coding regions. Here, we describe a powerful and simple method to detect signatures of balancing selection. In humans, it outperforms other methods commonly used to detect such signatures and could in theory be used for other species, provided that its power is evaluated for each species through neutral simulations. Our method (\"Non-Central Deviation\", NCD) has two versions: NCD2, which requires polymorphism information on the ingroup species, as well as divergence information between the ingroup and an outgroup species, and NCD1, which only requires the ingroup information. Although NCD2 is more powerful for humans, NCD1 can be used for species that lack information from an outgroup. When applying NCD2 to human data, using chimpanzee as the outgroup, we found more than 200 protein-coding regions with strong signatures of balancing selection, only 1/3 of which had prior evidence for balancing selection. There was also an enrichment for several gene ontology categories, approximately half of which are related to immunity. We also found that among genes with evidence for balancing selection there was an excess of cases of preferential expression in specific tissues, such as \"adrenal\" and \"lung\", and an excess of genes with mono-allelic expression. Overall, we found that selected regions of the genome include both coding and regulatory sites. We failed to find a marked excess of balancing selection in regulatory regions, as reported in previous studies. Finally, we found an excess of nonsynonymous versus synonymous polymorphisms within the selected genes. Having documented the occurrence of balancing selection in the human genome and identified genes which were potential targets of this selective regime, we next investigated evolutionary consequences of this process. We hypothesized that balancing selection acting on a site reduces the efficiency with which purifying selection purges deleterious variants at nearby sites. This process is a consequence of how the dynamics of selection at one locus, mediated by linkage, can interfere with the frequencies of adjacent non-neutral sites. We tested this hypothesis by examining if the genes under balancing selection show an excess of deleterious variants with respect to expectations derived from the remainder of the genome. Using three different metrics to determine deleteriousness, we identified a significant excess of deleterious variants within balanced genes, and we show that this pattern cannot be attributed to confounding factors. This finding shows that together with the benefits associated with adaptive variation, balancing selection is increasing the burden of deleterious mutations in the human genome. Overall, our findings suggest that balancing selection likely maintains variation in a myriad of biological processes other than immunity and that it has been more common in the human genome than previously thought, affecting between 1-8% of human protein-coding genes, as well as a number of non-protein coding regions. Moreover, balancing selection appears to be important to human evolution not only because of its influence on fitness, but also because it has been an important force shaping current human genetic diversity and susceptibility to diseas

    Polygenic Scores for Height in Admixed Populations

    No full text
    Polygenic risk scores (PRS) use the results of genome-wide association studies (GWAS) to predict quantitative phenotypes or disease risk at an individual level, and provide a potential route to the use of genetic data in personalized medical care. However, a major barrier to the use of PRS is that the majority of GWAS come from cohorts of European ancestry. The predictive power of PRS constructed from these studies is substantially lower in non-European ancestry cohorts, although the reasons for this are unclear. To address this question, we investigate the performance of PRS for height in cohorts with admixed African and European ancestry, allowing us to evaluate ancestry-related differences in PRS predictive accuracy while controlling for environment and cohort differences. We first show that the predictive accuracy of height PRS increases linearly with European ancestry and is partially explained by European ancestry segments of the admixed genomes. We show that recombination rate, differences in allele frequencies, and differences in marginal effect sizes across ancestries all contribute to the decrease in predictive power, but none of these effects explain the decrease on its own. Finally, we demonstrate that prediction for admixed individuals can be improved by using a linear combination of PRS that includes ancestry-specific effect sizes, although this approach is at present limited by the small size of non-European ancestry discovery cohorts

    HLA supertype variation across populations: new insights into the role of natural selection in the evolution of HLA-A and HLA-B polymorphisms

    No full text
    Supertypes are groups of human leukocyte antigen (HLA) alleles which bind overlapping sets of peptides due to sharing specific residues at the anchor positions—the B and F pockets—of the peptide-binding region (PBR). HLA alleles within the same supertype are expected to be functionally similar, while those from different supertypes are expected to be functionally distinct, presenting different sets of peptides. In this study, we applied the supertype classification to the HLA-A and HLA-B data of 55 worldwide populations in order to investigate the effect of natural selection on supertype rather than allelic variation at these loci. We compared the nucleotide diversity of the B and F pockets with that of the other PBR regions through a resampling procedure and compared the patterns of within-population heterozygosity (He) and between-population differentiation (G ST) observed when using the supertype definition to those estimated when using randomized groups of alleles. At HLA-A, low levels of variation are observed at B and F pockets and randomized He and G ST do not differ from the observed data. By contrast, HLA-B concentrates most of the differences between supertypes, the B pocket showing a particularly high level of variation. Moreover, at HLA-B, the reassignment of alleles into random groups does not reproduce the patterns of population differentiation observed with supertypes. We thus conclude that differently from HLA-A, for which supertype and allelic variation show similar patterns of nucleotide diversity within and between populations, HLA-B has likely evolved through specific adaptations of its B pocket to local pathogens
    corecore