232 research outputs found

    Stacks: Building and Genotyping Loci De Novo From Short-Read Sequences

    Get PDF
    Advances in sequencing technology provide special opportunities for genotyping individuals with speed and thrift, but the lack of software to automate the calling of tens of thousands of genotypes over hundreds of individuals has hindered progress. Stacks is a software system that uses short-read sequence data to identify and genotype loci in a set of individuals either de novo or by comparison to a reference genome. From reduced representation Illumina sequence data, such as RAD-tags, Stacks can recover thousands of single nucleotide polymorphism (SNP) markers useful for the genetic analysis of crosses or populations. Stacks can generate markers for ultra-dense genetic linkage maps, facilitate the examination of population phylogeography, and help in reference genome assembly. We report here the algorithms implemented in Stacks and demonstrate their efficacy by constructing loci from simulated RAD-tags taken from the stickleback reference genome and by recapitulating and improving a genetic map of the zebrafish, Danio rerio

    European Roma groups show complex West Eurasian admixture footprints and a common South Asian genetic origin

    Get PDF
    The Roma population is the largest transnational ethnic minority in Europe, characterized by a linguistic, cultural and historical heterogeneity. Comparative linguistics and genetic studies have placed the origin of European Roma in the Northwest of India. After their migration across Persia, they entered into the Balkan Peninsula, from where they spread into Europe, arriving in the Iberian Peninsula in the 15th century. Their particular demographic history has genetic implications linked to rare and common diseases. However, the South Asian source of the proto-Roma remains still untargeted and the West Eurasian Roma component has not been yet deeply characterized. Here, in order to describe both the South Asian and West Eurasian ancestries, we analyze previously published genome-wide data of 152 European Roma and 34 new Iberian Roma samples at a fine-scale and haplotype-based level, with special focus on the Iberian Roma genetic substructure. Our results suggest that the putative origin of the proto-Roma involves a Punjabi group with low levels of West Eurasian ancestry. In addition, we have identified a complex West Eurasian component (around 65%) in the Roma, as a result of the admixture events occurred with non-proto-Roma populations between 1270–1580. Particularly, we have detected the Balkan genetic footprint in all European Roma, and the Baltic and Iberian components in the Northern and Western Roma groups, respectively. Finally, our results show genetic substructure within the Iberian Roma, with different levels of West Eurasian admixture, as a result of the complex historical events occurred in the Peninsula.This work was supported by the Spanish Ministry of Economy and Competitiveness (grant number CGL2016-75389-P (MINEICO/FEDER, UE) and "Unidad María de Maeztu" (MDM-2014-0370) to DC and FC; and Agência de Gestió d'Ajuts Universitaris i de la Recerca (Generalitat de Catalunya, grant 2017SGR00702). NF-P was supported by a FPU17/03501 fellowship. The funders had no role in study design, data collection and analysis, decision to publish, or preparation of the manuscript

    Localizing Ashkenazic Jews to Primeval Villages in the Ancient Iranian Lands of Ashkenaz

    Get PDF
    TheYiddishlanguageisover1,000yearsoldandincorporatesGerman,Slavic,andHebrewelements.TheprevalentviewclaimsYiddish hasaGermanorigin,whereastheopposingviewpositsaSlavicoriginwithstrongIranianandweakTurkicsubstrata.Oneofthemajor difficulties in deciding between these hypotheses is the unknown geographical origin of Yiddish speaking Ashkenazic Jews (AJs). An analysis of 393 Ashkenazic, Iranian, and mountain Jews and over 600 non-Jewish genomes demonstrated that Greeks, Romans, Iranians,andTurksexhibitthehighestgeneticsimilaritywithAJs.TheGeographicPopulationStructureanalysislocalizedmostAJsalong major primeval trade routes in northeastern Turkey adjacent to primeval villages with names that may be derived from “Ashkenaz.” IranianandmountainJewswerelocalizedalongtraderoutesontheTurkey’seasternborder.Lossofmaternalhaplogroupswasevident in non-Yiddish speaking AJs. Our results suggest that AJs originated from a Slavo-Iranian confederation, which the Jews call “Ashkenazic” (i.e., “Scythian”), though these Jews probably spoke Persian and/or Ossete. This is compatible with linguistic evidence suggesting that Yiddish is a Slavic language created by Irano-Turko-Slavic Jewish merchants along the Silk Roads as a cryptic trade language, spoken only by its originators to gain an advantage in trade. Later, in the 9th century, Yiddish underwent relexification by adoptinganewvocabularythatconsistsofaminorityofGermanandHebrewandamajorityofnewlycoinedGermanoidandHebroid elements that replaced most of the original Eastern Slavic and Sorbian vocabularies, while keeping the original grammars intact

    Phylogeography of human Y-chromosome haplogroup Q3-L275 from an academic/ citizen science collaboration

    Get PDF
    Background: The Y-chromosome haplogroup Q has three major branches: Q1, Q2, and Q3. Q1 is found in both Asia and the Americas where it accounts for about 90% of indigenous Native American Y-chromosomes; Q2 is found in North and Central Asia; but little is known about the third branch, Q3, also named Q1b-L275. Here, we combined the efforts of population geneticists and genetic genealogists to use the potential of full Y-chromosome sequencing for reconstructing haplogroup Q3 phylogeography and suggest possible linkages to events in population history. Results: We analyzed 47 fully sequenced Y-chromosomes and reconstructed the haplogroup Q3 phylogenetic tree in detail. Haplogroup Q3-L275, derived from the oldest known split within Eurasian/American haplogroup Q, most likely occurred in West or Central Asia in the Upper Paleolithic period. During the Mesolithic and Neolithic epochs, Q3 remained a minor component of the West Asian Y-chromosome pool and gave rise to five branches (Q3a to Q3e), which spread across West, Central and parts of South Asia. Around 3–4 millennia ago (Bronze Age), the Q3a branch underwent a rapid expansion, splitting into seven branches, some of which entered Europe. One of these branches, Q3a1, was acquired by a population ancestral to Ashkenazi Jews and grew within this population during the 1st millennium AD, reaching up to 5% in present day Ashkenazi. Conclusions: This study dataset was generated by a massive Y-chromosome genotyping effort in the genetic genealogy community, and phylogeographic patterns were revealed by a collaboration of population geneticists and genetic genealogists. This positive experience of collaboration between academic and citizen science provides a model for further joint projects. Merging data and skills of academic and citizen science promises to combine, respectively, quality and quantity, generalization and specialization, and achieve a well-balanced and careful interpretation of the paternal-side history of human populations

    Genome-wide data from medieval German Jews show that the Ashkenazi founder event pre-dated the 14th century

    Get PDF
    We report genome-wide data from 33 Ashkenazi Jews (AJ), dated to the 14th century, obtained following a salvage excavation at the medieval Jewish cemetery of Erfurt, Germany. The Erfurt individuals are genet-ically similar to modern AJ, but they show more variability in Eastern European-related ancestry than mod-ern AJ. A third of the Erfurt individuals carried a mitochondrial lineage common in modern AJ and eight carried pathogenic variants known to affect AJ today. These observations, together with high levels of runs of homozygosity, suggest that the Erfurt community had already experienced the major reduction in size that affected modern AJ. The Erfurt bottleneck was more severe, implying substructure in medieval AJ. Overall, our results suggest that the AJ founder event and the acquisition of the main sources of ancestry pre-dated the 14th century and highlight late medieval genetic heterogeneity no longer present in modern AJ.The study was funded by the Israel Science Foundation grant 407/17 and the United States-Israel Binational Science Foundation grant 2017024 to S.C., by the National Science Foundation (USA) grants 1912776 and 0922374 to V.R., by the MCIN/AEI/10.13039/501100011033 and by "ESF Investing in your future" grant "Ayudas para contratos Ramon y Cajal" to I.O., and by the following grants to D.R.: NIH grants GM100233 and HG012287; the Allen Discovery Center program, a Paul G. Allen Frontiers Group advised program of the Paul G. Allen Family Foundation; John Templeton Foundation grant 61220; a private gift from Jean-Francois Clin; and the Howard Hughes Medical Institute

    DNA and pacific commensal models : applications, construction, limitations, and future prospects

    Get PDF
    Components of the Pacific transported landscape have been used as proxies to trace the prehistoric movement of humans across the Pacific for almost two decades. Analyses of archaeological remains and DNA sequences of plants, animals, and microorganisms moved by or with humans have contributed to understanding prehistoric migration, trade, exchange, and sometimes revealed the geographic origins of particular plants and animals. This paper presents the basic elements of a DNA-based commensal model and discusses the phylogenetic and population genetic approaches these models employ. A clear delineation of the underlying assumptions of these models and the background information required to construct them have yet to appear in the literature. This not only provides a framework with which to construct a commensal model but also highlights gaps in current knowledge. The ways in which commensal models have enriched archaeological reconstructions will be highlighted, as will their current limitations. With these limitations in mind, options will be outlined for augmenting commensal models through the application of established techniques and new technologies in order to provide the best tools for reconstructing ancient human mobility and behavior in the Pacific and beyond

    Developing new tools to address the impact of climate change on the evolutionary and distributional history in plant lineages

    Full text link
    Tesis doctoral inédita leída en la Universidad Autónoma de Madrid, Facultad de Ciencias, Departamento de Biología. Fecha de lectura: 28-02-202

    Analysis of the neutral and adaptive genetic variation of Colletotrichum kahawae and its relationship with the C. gloeosporioides complex

    Get PDF
    Tese de mestrado. Biologia (Biologia Humana e Ambiente). Universidade de Lisboa, Faculdade de Ciências, 2010O café é uma dos produtos mais comercializados em todo o mundo, contribuindo significativamente para a economia de mais de 60 países tropicais. A sua importância a nível económico e social é patente quando se considera que centenas de milhões de pessoas dependem, directa ou indirectamente, do rendimento que esta industria lhes fornece para garantir o seu bem-estar e qualidade de vida. No entanto, a sua produção pode ser extremamente sensível a distúrbios provenientes de factores extrínsecos, tal como as doenças fúngicas, e as consequências que daí advêm acarretam efeitos socioeconómicos devastadores para muitos dos países produtores. Por outro lado, a maioria das variedades de cafeeiro actualmente cultivadas em todo o mundo, resultam de um recente período de domesticação que, apesar de ter permitido a criação de variedades extremamente produtivas e de alta qualidade, diminuiu grandemente a variabilidade genética das suas populações. Em termos práticos, tem-se reconhecido cada vez mais que este evento homogeneizador fomenta a emergência e disseminação de agentes patogénicos, facilitando a sua adaptação e transmissão entre hospedeiros. Deste modo, e dada a crescente ameaça que as doenças causadas por estes agentes patogénicos estão a gerar, torna-se essencial que as estratégias para o seu controlo incluam a maior quantidade possível de informação no que toca aos aspectos evolutivos e demográficos desses agentes, analisando as assinaturas deixadas na estrutura das suas populações e que se reflectem na variação neutral e adaptativa na A antracnose dos frutos verdes do cafeeiro, conhecida como Coffee Berry Disease, é uma devastadora doença que Coffea arabica, a espécie de cafeeiro mais importante e valiosa no mercado. Esta doença, causada pelo fungo Colletotrichum kahawae, é relativamente recente, tendo sido documentada pela primeira vez no Quénia em 1922. Desde então, tem-se disseminado por todos as regiões onde o cafeeiro Arábica é cultivado no continente Africano, onde ainda hoje se encontra confinada. No entanto, uma vez que esta doença é dada como o principal factor limitativo na produção de café Arábica neste continente, o receio da sua dispersão para outros países produtores, particularmente para América Latina, é motivo de grande preocupação. Vários estudos têm sido realizados na perspectiva de entender como é que C. kahawae surgiu e como é que as suas populações estão estruturadas, de maneira a retirar informação acerca do seu potencial patogénico, assim de como essas populações evoluíram e dispersaram ao longo do tempo e do espaço. No entanto, apesar do esforço empreendido, este agente patogénico tem revelado uma variabilidade genética extremamente baixa, o que até agora tem limitado possíveis inferências acerca da sua história evolutiva. Deste modo, a maioria da informação que se tem acerca da sua origem e disseminação baseia-se em dados históricos. Duas razões principais têm sido invocadas para explicar a uniformidade genética de C. kahawae. Em primeiro lugar, supõe-se que tenha tido uma origem recente do grupo de espécies próximo, C. gloeosporioides, e três hipóteses têm sido propostas nas quais a sua emergência terá ocorrido através de: 1) mutação a partir de uma linhagem ligeiramente patogénica de C. gloeosporioides existente em cafeeiros Arábica; 2) hibridação entre duas linhagens de C. gloeosporioides presentes nas espécies parentais de C. arabica, como C. canephora ou C. eugenioides; 3) transferência de uma das espécies parentais de C. arabica, onde estaria presente como saprófita, para se tornar um agente patogénico agressivo no cafeeiro Arábica quando este foi reintroduzido no continente africano para fins comerciais. No entanto, C. gloeosporioides é um complexo de espécies extremamente abrangente, que ocorre em mais de 1800 espécies vegetais, e tem permanecido taxonomicamente mal descrito, pelo que a simples afirmação da sua proximidade com C. kahawae traz muito pouca informação. Deste modo, a questão mais relevante que se coloca é de que linhagem dentro deste complexo terá surgido C. kahawae. A segunda razão diz respeito à assexualidade de C. kahawae. A ausência de fase sexuada, quer em meio de cultura, quer no campo, associada à sua estrutura populacional aparentemente clonal, têm sido mencionadas como evidências sugestivas da assexualidade desta espécie, embora inconclusivas. Neste aspecto, uma análise complementar útil e que tem levado a uma informação mais completa sobre o modo sexual de várias espécies de fungos, tem sido a investigação da evolução molecular dos genes que regulam a reprodução sexual, designados genes MAT, entre espécies próximas, tal como C. kahawae e C. gloeosporioides. Por outro lado, o género Colletotrichum possui um sistema genético de reconhecimento sexual único em todo o reino dos fungos, e cujo conhecimento acerca da evolução destes genes tem permanecido desconhecido. Neste trabalho, recorrendo a várias ferramentas laboratoriais e analíticas da biologia molecular, pretendeu-se cumprir dois amplos objectivos. Em primeiro lugar, desenvolver novos marcadores moleculares mais informativos do ponto de vista filogenético e filogeográfico, que pudessem ser postos em prática para concretizar o segundo objectivo, de desvendar não só as relações filogenéticas entre isolados de C. kahawae e de C. gloeosporioides, mas também a diversidade genética e estrutura populacional de C. kahawae, de maneira a se poderem realizar inferências acerca da sua origem e dispersão. Neste trabalho foi conseguido com sucesso o desenvolvimento de seis novos marcadores moleculares na região genómica Apn1/MAT, que se revelaram extremamente variáveis e mais informativos que os marcadores tradicionalmente usados. Usando uma amostragem representativa de 22 isolados de várias espécies dentro do complexo C. gloeosporioides e incluindo C. kahawae, aplicaram-se estes novos marcadores, verificando-se que o aumento do nível de resolução das relações evolutivas entre espécies, e até entre populações, era extremamente significativo. Um dos marcadores desenvolvidos, que compreende uma região inter-génica, revelou um potencial singular em termos informativos, permitindo por si só uma inferência filogenética equivalente à concatenação de sete marcadores. Por outro lado, uma vez que o tempo de divergência entre várias espécies próximas dentro de complexos tende a ser muito reduzido, detectou-se ainda uma presença acentuada do fenómeno de lineage sorting incompleto, que tem como uma consequência a discordância entre as topologias das árvores filogenéticas reconstruídas a partir dos vários marcadores utilizados. Salienta-se deste modo, ser essencial o uso de marcadores de vários loci no genoma para a resolução deste problema. Com base na selecção dos loci mais variáveis, analisou-se um total de 85 isolados, compreendendo uma extensa amostragem de isolados provenientes de uma vasta área onde C. kahawae é encontrado, assim como uma selecção representativa de isolados de C. gloeosporioides de Coffea spp. e de outros hospedeiro. Utilizando um conjunto de seis marcadores moleculares (ITS, β-tub2, ApMAT, Apn15L, MAT1-2-1 e MAT5L) e recorrendo a abordagens analíticas filogenéticas e filogeográficas, os resultados obtidos revelaram uma divergência muito superior ao esperada entre C. kahawae e isolados de C. gloeosporioides de cafeeiros, o que não suportava a hipótese de uma origem recente. Por outro lado, uma linhagem de C. gloeosporioides proveniente de Mangifera indica apresentou uma relação filogenética extremamente próxima com C. kahawae, ainda que biologicamente fosse uma espécie distinta devido à sua incapacidade de causar sintomas de antracnose nos frutos verdes. Estes dados sugerem que o agente patogénico, C. kahawae, possa ter emergido saltando de um hospedeiro diferente para os cafeeiros, ao contrário do pensamento corrente em que C. kahawae evoluiu e emergiu do género Coffea. Por outro lado, foi também possível desvendar alguma variação genética dentro de C. kahawae, distinguindo-se três grupos de haplótipos que estavam intimamente relacionados e estruturados de acordo com a sua distribuição geográfica. Reconstruindo o estado ancestral desses três grupos e com base na amostragem utilizada, verificou-se que o grupo da região Angolana era o mais ancestral, enquanto os isolados do Quénia e de outras regiões do Este Africano eram derivados desse grupo. Estes resultados vêm contrariar a ideia actual da origem de C. kahawae centrada no Quénia e sugerem uma hipótese alternativa, que aparentemente não é suportada e dificilmente seria prevista à luz dos dados históricos disponíveis. No entanto, a origem assumida para C. kahawae baseia-se na premissa de que este emergiu a partir de espécies de cafeeiros, o que pode não corresponder à realidade e que de alguma forma fornece uma possível explicação para o padrão evolutivo encontrado no nosso estudo. Finalmente, com a mesma amostragem, foi realizada uma análise da evolução molecular do gene MAT, MAT1-2-1, baseada em modelos estatísticos de máxima verosimilhança (Maximum likelihood), que se revelou que este gene parece estar sob uma intensa selecção purificadora, possivelmente devido a uma função biológica importante. Apesar disso, dois haplótipos separados por uma mutação não-sinónima foram encontrados nos grupos de C. kahawae, revelando a inesperada presença de duas proteinas diferentes ao nível da sequência de aminoácidos numa espécie tão geneticamente uniforme. Apesar de não se conseguir excluir a hipótese uma variação fenotípica neutral, este evento pode sugerir que esta proteína tenha um papel adaptativo a nível populacional dentro de C. kahawae. No geral, este trabalho cumpriu os objectivos a que foi proposto, revelando resultados inesperados e que irão certamente requerer uma investigação futura para apurar as hipóteses aqui levantadas. Espera-se assim que ele venha a ter impacto na comunidade científica interessada nesta doença e agente patogénico e que venha a estimular futuros estudos e trabalhos na biologia evolutiva deste agente patogénico, tão relevante ao nível económico e social. No geral, este trabalho cumpriu os objectivos propostos, revelando resultados inovadores e inesperados, particularmente na origem do agente patogénico estudado, e que irão certamente requerer uma investigação futura para apurar as hipóteses aqui levantadas. Espera-se assim que ele venha a contribuir para o aumento do conhecimento e que seja útil para a comunidade científica interessada nesta doença e agente patogénico, tão relevante a nível económico e social.In this work, a range of phylogenetic, phylogeographic and statistical methods of molecular evolution were used to investigate the evolutionary biology of an emergent pathogen in coffee crops (Coffea spp.), Colletotrichum kahawae. C. kahawae was first reported in Kenya, 1922, and causes severe disease (Coffee Berry Disease) in Arabica coffee throughout the African continent, where it is still restricted. However, the origin and spread of this pathogen has hitherto relied on historical data, and molecular studies have not been able to unearth enough genetic variation to infer about these processes, possibly due to its putative asexual nature and assumed recent evolution from Coffea spp. inhabiting strains of the C. gloeosporioides complex. To address this issue, a set of molecular markers was successfully developed, including a mating-type gene (MAT1-2-1), showing a greater informative potential than traditional markers. The most valuable markers were selected and used to analyze a representative sampling of C. kahawae, throughout most of its range, and C. gloeosporioides, mainly from Coffea spp. worldwide. Unexpectedly, the obtained results from the evolutionary relationships between C. kahawae and C. gloeosporioides suggest that the former may have emerged through a hostshift from hosts other than Coffea spp.. Moreover, the phylogeographic analysis of C. kahawae revealed a geographically structured population and the Angolan group as the most ancestral state inferred. Although our results come in opposition to the current Kenyan hypothesis and are not supported by the historical reports, the prevailing view follows the premise that C. kahawae evolved from Coffea spp., which our data suggests otherwise. Regarding the molecular evolution of MAT1-2-1, our results suggest a possible adaptive role within C. kahawae populations, due to the presence of two haplotypes in a highly conserved gene. These results have significantly contributed to fill a void in the current knowledge of the evolutionary biology of this pathogen and will hopefully stimulate further research

    Systematics of the North American Plums (Prunus subgenus Prunus section \u3cem\u3ePrunocerasus\u3c/em\u3e; Rosaceae)

    Get PDF
    The North American plums (Prunus subgenus Prunus section Prunocerasus; Rosaceae) are a closely related group with approximately 17 commonly recognized species and lesser taxa. They are infamous for their very poor development of reproductively isolating barriers and most are interfertile in many combinations. This interfertility blurs nearly all morphologically-based taxonomic boundaries. Even still, geographically related morphological variation exists and when intermediates are ignored several taxa may be seen as being reasonably different from one another with respect to both morphology and ecology. Additionally, the ranges of most of the North American plum taxa overlap with the ranges of several others. The only exception is P. subcordata, which is the only species in the section whose range is west of the Rocky Mountains. The aim of this dissertation research was to infer a phylogeny for the group in an attempt to understand their complicated evolutionary history. Emphasis was placed on using molecular tools (e.g., PCR and DNA sequencing) to tease apart their intricate relationships. The importance of this course of study includes but is not limited to: (1) better understanding a difficult group of taxa for academic reasons, (2) accumulating data to better understand these taxa so that conservation efforts can be better focused (e.g., P. geniculate is Federally Endangered), (3) better understanding the relationships among a group of plants with economic importance, (4) testing the limits of tools currently used in plant molecular systematics—the North American plums posit a problem at the boundary between molecular phylogenetics and population genetics, and (5) adding to a body of knowledge surrounding longstanding biogeographic questions of North America, namely the Atlantic and Gulf Coastal Plain disjunction to the Great Lakes region and the eastern North America-western North America disjunction. This research dissertation is the accumulation of information from four original research papers and a National Science Foundation Dissertation Improvement Grant. All papers have either been published, submitted, or will be submitted to the American Journal of Botany The results of this coarse of study showed that (1) predictable rate heterogeneity exists among noncoding cpDNA regions and several rarely used regions provide more mutations to phylogenetic investigations than the most commonly used regions (Part 3). (2) The North American plums are monophyletic (Part 4). (3) Most North American plum taxa are para- and polyphyletic with respect to their chloroplasts—more than one of the three primary chloro-haplotypes was observed in 12 of 17 of the North American plum taxa (Part 5). (4) Most North American plum taxa are not monophyletic with respect to their nuclear encoded s6pdh genes—three primary haplotypes are shared among most taxa (Part 6). Total evidence provided by this investigation strongly supports the hypothesis of the North American plums are a syngameon, or hybridizing species group
    corecore