23 research outputs found

    Suomen geneettinen populaatiorakenne : haplotyyppi-informaatioon ja riippumattomiin geenimerkkeihin perustuvien menetelmien vertailua

    Get PDF
    Studies of population structure are motivated by the need to understand population history and to have well-characterised groups of individuals in studies of genetics of diseases and traits. A standard method to analyse genetic population structure is principal component analysis (PCA). A disadvantage of PCA is that it can reliably handle only independent genetic markers. This means that the genetic markers that are correlated with other genetic markers have to be excluded from the data. This leads to a loss of information. In 2012, Lawson et al. published a chromosome painting method that can utilise haplotype information, i.e. information from correlated markers, and thus it can detect more subtle differences in populations than the standard PCA. This thesis studies two questions. The first question is whether the chromosome painting method can provide more precise genetic clustering of geographically defined Finnish groups than the standard PCA method. The second question is whether the chromosome painting method can reveal new details of population structure in Finland. The data used in this study are from the FINRISK Study survey of 1997. This cohort includes the genotype data of about 4,000 individuals and the information about individuals and their parents birthplaces. 345 Individuals were randomly chosen from the cohort in such a way that both of their parents were originated from the same province. Ten provinces of Finland were used as study groups for the method comparison. First, the data were analysed with SmartPCA (a standard PCA method) and ChromoPainter (the chromosome painting method) and the results were compared both visually and quantitatively. Finally, the individuals were assigned to populations based on the ChromoPainter result using FineSTRUCTURE program and these genetic populations were compared to the geographic origin of the individuals. The results showed that the chromosome painting method clustered seven out of ten groups significantly tighter than the standard PCA. Nevertheless, SmartPCA was faster and easier to use than ChromoPainter. The main population genetic division was found between the eastern and western parts of Finland, which was consistent with earlier studies. All in all, 15 populations were detected and the results revealed that they were geographically clustered. The genetic populations correlated well with the borders of Finnish provinces and counties. As the first conclusion, the chromosome painting method was able to give more precise results than the standard PCA but the standard PCA is still more suitable for quick preliminary analyses of genetic data. As the second conclusion, the chromosome painting method was able to detect detailed subpopulation structure in Finland and these populations are geographically clustered. Results provide an excellent basis for the future studies of population structure and genetic diseases in Finland.Populaatiorakenteen tutkimusta motivoi parhaiten ihmisen halu tuntea alkuperänsä. Lisäksi populaatiorakenteen ymmärtäminen on tärkeää geneettisten sairauksien tutkimuksessa. Esimerkiksi tapaus-verrokkitutkimuksissa tutkittavien ryhmien tulisi vastata toisiaan eri muuttujien, myös geneettisen rakenteen, suhteen. Jos ryhmien välillä on otannasta johtuvaa geneettistä eroa, voivat tulokset johtaa väärään johtopäätökseen, jossa tutkittava asia assosioituu perimään virheellisesti. Yksi käytetyimmistä menetelmistä yksilöiden välisten geneettisten erojen havaitsemiseen on pääkomponenttianalyysi (PCA). PCA:n ongelma on kuitenkin se, että se voi analysoida luotettavasti ainoastaan riippumattomia geenimerkkejä. Tämä tarkoittaa, että geneettisestä aineistosta on poistettava kytkeytyneet geenimerkit ja tietoa yksilöiden välisistä pienistä eroista katoaa. Vuonna 2012 Lawson ym. kehittivät menetelmän, joka pystyy huomioimaan myös kytkeytyneet geenimerkit. Tämä kromosomin jaottelumenetelmä tutkii yksilöiden genomia haplotyypeittäin. Näin ollen kromosomin jaottelumenetelmä mahdollistaa yksityiskohtaisemman populaatioiden tutkimisen kuin perinteinen pääkomponenttianalyysi. Tämä tutkielma keskittyy kahteen pääkysymykseen. Ensimmäinen kysymys on, pystyykö kromosomin jaottelumenetelmä erottamaan ja ryhmittämään maantieteellisesti samoilta alueilta peräisin olevat yksilöt paremmin kuin perinteinen PCA-menetelmä. Toinen kysymys on, pystyykö kromosomin jaottelumenetelmä löytämään uusia hienorakenteita Suomen populaatiorakenteesta. Tutkimuksen käytettiin aineistona suomalaista FINRISKI 1997 -tutkimusta, joka koostuu n. 4 000 yksilön genotyyppiaineistosta sekä yksilöiden ja heidän vanhempiensa syntymäpaikkatiedoista. Aineistosta valittiin satunnaisesti 345 yksilöä, joiden molemmat vanhemmat ovat kotoisin samasta läänistä. Tutkimuksessa oli mukana yksilöitä kymmenestä läänistä ja läänejä käsiteltiin vertailussa omina ryhminään. Ensimmäiseksi aineisto analysoitiin käyttäen SmartPCA (perinteinen PCA-menetelmä) sekä ChromoPainter (kromosomin jaottelumenetelmä) -ohjelmia ja tuloksia vertailtiin sekä visuaalisesti että kvantitatiivisesti. Tämän jälkeen yksilöt jaettiin populaatioihin kromosomin jaottelumenetelmän tulosten perusteella käyttäen FineSTRUCTURE-ohjelmaa. Lopuksi populaatiojakoa verrattiin yksilöiden maantieteelliseen alkuperään. Työn tulokset osoittivat, että kromosomin jaottelumenetelmä ryhmitteli selkeästi tiiviimmin seitsemän kymmenestä testiryhmästä kuin perinteinen PCA. Kuitenkin SmartPCA oli nopeampi ja helppokäyttöisempi kuin ChromoPainter. Geneettisissä populaatiotuloksissa erottui ensimmäisenä jako Itä- ja Länsi-Suomen välillä, mikä vastaa hyvin aiempien tutkimusten tuloksia. Kaiken kaikkiaan Suomesta löytyi yhteensä 15 populaatiota, joiden maantieteelliset alueet noudattelivat pääosin Suomen entisten läänien ja maakuntien rajoja. Ensimmäisenä johtopäätöksenä todettiin, että kromosomin jaottelumenetelmä antaa tarkempia tuloksia kuin perinteinen PCA. Perinteinen PCA kuitenkin soveltuu edelleen alustaviin analyyseihin nopeutensa vuoksi. Toisena johtopäätöksenä todettiin, että kromosomin jaottelumenetelmä löysi ennennäkemättömiä hienorakenteita Suomesta ja nämä rakenteet ovat maantieteellisesti ryhmittyneitä. Tulokset luovat erinomaisen pohjan populaatiorakenteen ja geneettisten sairauksien jatkotutkimukselle Suomessa

    Geneettinen hienorakenne ja polygeeniset riskiarvot Suomessa

    Get PDF
    Population genetics is today an essential part of the studies of human origin and history, as well as of the studies of disease genetics. Populations living apart from each other exhibit genetic variation and this variation between populations is called genetic structure. By studying the genetic structure around the world, it has become possible, for example, to elaborate on the migration patterns of modern humans from the African continent to the rest of the world during the last 100,000 years. In addition, the modern methods of population genetics have enabled a very detailed analysis of genetic structure and population history within single countries, but these methods have not yet been widely utilized in isolated populations such as in Finland. In medical genetics, the genetic background of diseases is routinely analyzed with a genome-wide association study (GWAS). In these studies, it is important to control for the genetic structure of the data appropriately, so that the genetic variation associated with the disease can be reliably distinguished from the general genetic variation associated with the genetic structure. The results of GWAS are used in research to predict the genetic disease risk of an individual using a polygenic score that summarizes the estimated genetic risk over multiple sites of the genome. Because of this summation, even a tiny bias in the GWAS results, due to the genetic structure, can lead to a significant bias in polygenic scores, which, in turn, can lead to incorrect conclusions especially in comparisons between populations. Therefore, understanding the genetic structure and its role in building polygenic scores is exceptionally important to properly understand both the benefits and limitations of polygenic scores in academic research and in future health-care applications. This doctoral thesis examined the fine-scale genetic structure and its role in the geographic distribution of polygenic scores in Finland. The first part of the thesis expanded the understanding of the genetic structure of Finland by determining the geographic border for the major genetic split between East and West Finland, and by identifying 17 previously unreported genetic fine-scale populations. The fine-scale populations were observed to be geographically clustered and to follow Finnish dialect regions. The second part of the thesis utilized the earlier results by building, based on the fine-scale genetic structure, reference groups to estimate the genetic ancestry profile of an individual within Finland. By estimating the genetic ancestry profiles for a set of individuals born between 1923 and 1987, this second study was able to map annual changes in the fine-scale genetic structure within 12 regions. The annual profiles matched well with the migration patterns of Karelian evacuees who were displaced by the war events between 1939 and 1945. The third part of the thesis assessed the role of the genetic split between East and West in the geographic distribution of the genetic risk of five complex diseases (coronary artery disease, rheumatoid arthritis, schizophrenia, ulcerative colitis, and Crohn’s disease) and three quantitative traits (height, body mass index, and waist-hip ratio) using polygenic scores. The third study demonstrated that most of the polygenic scores, that did show geographic variation, mirrored the genetic split between East and West Finland but also revealed bias associated with the genetic structure in Finland. This final study thus demonstrated two main points: first that polygenic scores are susceptible to genetic structure-related biases, even within a relatively homogeneous populations; and second that it is challenging to link population-genetic variation to geographic variation in disease incidence with the current methods. Overall, the results of this doctoral thesis update the current understanding of fine-scale genetic structure in Finland and its changes to meet the needs of modern genetics research. It also demonstrates, both for the scientific community and for the general public, the importance of understanding the genetic structure in the study of both population history and polygenic scores.Populaatiogenetiikka on nykyisin olennainen osa ihmisen alkuperän ja historian sekä tautien geneettistä tutkimusta. Erillään toisistaan elävien populaatioiden välillä havaitaan geneettisiä eroja, ja tätä populaatioiden välistä vaihtelua kutsutaan geneettiseksi rakenteeksi. Tutkimalla geneettistä rakennetta eri puolilla maailmaa on esimerkiksi pystytty tarkentamaan nykyihmisen levittäytymisreittejä Afrikan mantereelta muualle maailmaan viimeisen 100,000 vuoden aikana. Populaatiogenetiikan modernit menetelmät ovat myös mahdollistaneet geneettisen rakenteen ja populaatiohistorian yksityiskohtaisen analysoinnin yksittäisten maiden sisällä, mutta näitä menetelmiä ei ole vielä laajasti hyödynnetty eristäytyneissä populaatioissa kuten Suomessa. Lääketieteellisessä genetiikassa tautien geneettistä taustaa analysoidaan rutiininomaisesti perimänlaajuisissa assosiaatiotutkimuksissa (GWAS). Näissä tutkimuksissa on tärkeää kontrolloida aineiston geneettinen rakenne kunnolla, jotta voidaan luotettavasti erottaa tautiin liittyvä geneettinen vaihtelu populaatioiden geneettiseen rakenteeseen liittyvästä yleisestä vaihtelusta. GWAS-tutkimusten tuloksia käytetään tieteellisessä tutkimuksessa ennustamaan yksilöiden geneettistä sairastumisriskiä polygeensellä riskiarvolla, joka summaa yhteen usean perimänkohdan arvioidun geneettisen riskin. Summaamisesta johtuen pienikin geneettisestä rakenteesta johtuva harha GWAS-tuloksissa voi aiheuttaa merkittävää harhaa polygeenisiin riskiarvoihin, mikä puolestaan voi johtaa virheellisiin johtopäätöksiin erityisesti populaatioiden välisissä vertailuissa. Näin ollen geneettisen rakenteen tunteminen ja sen rooli polygeenisten riskiarvojen koostamisessa onkin erityisen tärkeää, jotta voimme ymmärtää sekä polygeenisten riskiarvojen hyödyt että rajoitteet akateemisessa tutkimuksessa ja mahdollisissa tulevaisuuden terveydenhuollon sovelluksissa. Tässä väitöskirjatutkimuksessa tutkittiin suomalaisten geneettistä hienorakennetta ja sen roolia polygeenisten riskiarvojen maantieteellisessä jakautumisessa Suomessa. Väitöskirjan ensimmäinen osa laajensi ymmärrystä Suomen geneettisestä rakenteesta määrittämällä maantieteellisen rajan Suomen geneettiselle pääjaolle Itä- ja Länsi-Suomen välillä ja tunnistamalla 17 ennen näkemätöntä geneettistä hienopopulaatiota. Hienopopulaatioiden havaittiin olevan maantieteellisesti keskittyneitä ja noudattelevan Suomen murrealueita. Toisessa osassa hyödynnettiin aiempia tuloksia muodostamalla hienorakenteen pohjalta vertailuryhmät yksilön geneettisen alkuperäprofiilin määrittämiselle Suomen sisällä. Määrittämällä geneettinen alkuperäprofiili joukolle 1923 ja 1987 välillä syntyneitä yksilöitä, tutkimus onnistui kartoittamaan vuosittaisia muutoksia Suomen geneettisessä hienorakenteessa 12 alueella. Vuosittaiset profiilit vastasivat hyvin 1939–1945 sotatapahtumien seurauksena käynnistyneitä karjalaisten evakkojen muuttoliikkeitä. Kolmas osa arvioi edellä mainitun geneettisen itä-länsi jaon roolia viiden monitekijäisen taudin (sepelvaltimotauti, nivelreuma, skitsofrenia, haavainen koliitti ja Crohnin tauti) ja kolmen mitattavan ominaisuuden (pituus, painoindeksi ja lantio-vyötärö-suhde) geneettisen riskin maantieteellisen jakauman taustalla polygeenisiä riskiarvoja käyttäen. Tutkimus osoitti, että useimmat polygeeniset riskiarvot, joissa maantieteellisiä eroja havaittiin, heijastelivat geneettistä jakoa Itä- ja Länsi-Suomen välillä, mutta sisälsivät myös geneettiseen rakenteeseen liittyvää tilastollista virhettä. Tutkimus osoitti, että polygeeniset riskiarvot ovat alttiita geneettiseen rakenteeseen liittyvälle harhalle myös suhteellisen samankaltaisissa populaatioissa ja että yhteyttä populaatioiden geneettisen vaihtelun ja alueellisten sairastuvuuserojen välillä on vaikea osoittaa. Kokonaisuutena tämän väitöskirjan tulokset päivittivät ymmärryksen Suomen yksityiskohtaisesta geneettisestä rakenteesta ja sen muutoksista vastaamaan nykyaikaisen geneettisen tutkimuksen tarpeita, ja havainnollisti sekä tiedeyhteisölle että suurelle yleisölle geneettisen rakenteen tuntemuksen merkityksen niin populaatiohistorian kuin polygeenisten riskiarvojen tutkimuksessa

    Changes in the fine-scale genetic structure of Finland through the 20(th) century

    Get PDF
    Information about individual-level genetic ancestry is central to population genetics, forensics and genomic medicine. So far, studies have typically considered genetic ancestry on a broad continental level, and there is much less understanding of how more detailed genetic ancestry profiles can be generated and how accurate and reliable they are. Here, we assess these questions by developing a framework for individual-level ancestry estimation within a single European country, Finland, and we apply the framework to track changes in the fine-scale genetic structure throughout the 20(th) century. We estimate the genetic ancestry for 18,463 individuals from the National FINRISK Study with respect to up to 10 genetically and geographically motivated Finnish reference groups and illustrate the annual changes in the fine-scale genetic structure over the decades from 1920s to 1980s for 12 geographic regions of Finland. We detected major changes after a sudden, internal migration related to World War II from the region of ceded Karelia to the other parts of the country as well as the effect of urbanization starting from the 1950s. We also show that while the level of genetic heterogeneity in general increases towards the present day, its rate of change has considerable differences between the regions. To our knowledge, this is the first study that estimates annual changes in the fine-scale ancestry profiles within a relatively homogeneous European country and demonstrates how such information captures a detailed spatial and temporal history of a population. We provide an interactive website for the general public to examine our results. Author summary We have inherited our genomes from our parents, who, in turn, inherited their genomes from their parents, etc. Hence, a comparison between genomes of present day individuals reveals genetic population structure due to the varying levels of genetic relatedness among the individuals. We have utilized over 18,000 Finnish samples to characterize the fine-scale genetic population structure in Finland starting from a binary East-West division and ending up with 10 Finnish source populations. Furthermore, we have applied the resulting ancestry information to generate records of how the population structure has evolved each year between 1923 and 1987 in 12 geographical regions of Finland. For example, the war-related evacuation of Karelians from Southeast Finland to other parts of the country show up as a clear, sudden increase in the Evacuated ancestry elsewhere in Finland between 1939 and 1945. Additionally, different regions of Finland show very different levels of genetic mixing in 1900s, from little mixed regions like Ostrobothnia to highly mixed regions like Southwestern Finland. To distribute the results among general public, we provide an interactive website for browsing the municipality and region-level genetic ancestry profiles atPeer reviewe

    Fine-Scale Genetic Structure in Finland

    Get PDF
    Coupling dense genotype data with new computational methods offers unprecedented opportunities for individual-level ancestry estimation once geographically precisely defined reference data sets become available. We study such a reference data set for Finland containing 2376 such individuals from the FINRISK Study survey of 1997 both of whose parents were born close to each other. This sampling strategy focuses on the population structure present in Finland before the 1950s. By using the recent haplotype-based methods ChromoPainter (CP) and FineSTRUCTURE (FS) we reveal a highly geographically clustered genetic structure in Finland and report its connections to the settlement history as well as to the current dialectal regions of the Finnish language. The main genetic division within Finland shows striking concordance with the 1323 borderline of the treaty of Noteborg. In general, we detect genetic substructure throughout the country, which reflects stronger regional genetic differences in Finland compared to, for example, the UK, which in a similar analysis was dominated by a single unstructured population. We expect that similar population genetic reference data sets will become available for many more populations in the near future with important applications, for example, in forensic genetics and in genetic association studies. With this in mind, we report those extensions of the CP + FS approach that we found most useful in our analyses of the Finnish data.Peer reviewe

    Geographic Variation and Bias in the Polygenic Scores of Complex Diseases and Traits in Finland

    Get PDF
    Polygenic scores (PSs) are becoming a useful tool to identify individuals with high genetic risk for complex diseases, and several projects are currently testing their utility for translational applications. It is also tempting to use PSs to assess whether genetic variation can explain a part of the geographic distribution of a phenotype. However, it is not well known how the population genetic properties of the training and target samples affect the geographic distribution of PSs. Here, we evaluate geographic differences, and related biases, of PSs in Finland in a geographically well-defined sample of 2,376 individuals from the National FINRISK study. First, we detect geographic differences in PSs for coronary artery disease (CAD), rheumatoid arthritis, schizophrenia, waist-hip ratio (WHR), body-mass index (BMI), and height, but not for Crohn disease or ulcerative colitis. Second, we use height as a model trait to thoroughly assess the possible population genetic biases in PSs and apply similar approaches to the other phenotypes. Most importantly, we detect suspiciously large accumulations of geographic differences for CAD, WHR, BMI, and height, suggesting bias arising from the population's genetic structure rather than from a direct genotype-phenotype association. This work demonstrates how sensitive the geographic patterns of current PSs are for small biases even within relatively homogeneous populations and provides simple tools to identify such biases. A thorough understanding of the effects of population genetic structure on PSs is essential for translational applications of PSs.Peer reviewe

    The role of polygenic risk and susceptibility genes in breast cancer over the course of life

    Get PDF
    Polygenic risk scores (PRS) for breast cancer have potential to improve risk prediction, but there is limited information on their utility in various clinical situations. Here we show that among 122,978 women in the FinnGen study with 8401 breast cancer cases, the PRS modifies the breast cancer risk of two high-impact frameshift risk variants. Similarly, we show that after the breast cancer diagnosis, individuals with elevated PRS have an elevated risk of developing contralateral breast cancer, and that the PRS can considerably improve risk assessment among their female first-degree relatives. In more detail, women with the c.1592delT variant in PALB2 (242-fold enrichment in Finland, 336 carriers) and an average PRS (10-90(th) percentile) have a lifetime risk of breast cancer at 55% (95% CI 49-61%), which increases to 84% (71-97%) with a high PRS (>90(th) percentile), and decreases to 49% (30-68%) with a low PRS (Peer reviewe

    Contribution of rare and common variants to intellectual disability in a sub-isolate of Northern Finland

    Get PDF
    The contribution of de novo variants in severe intellectual disability (ID) has been extensively studied whereas the genetics of mild ID has been less characterized. To elucidate the genetics of milder ID we studied 442 ID patients enriched for mild ID (>50%) from a population isolate of Finland. Using exome sequencing, we show that rare damaging variants in known ID genes are observed significantly more often in severe (27%) than in mild ID (13%) patients. We further observe a significant enrichment of functional variants in genes not yet associated with ID (OR: 2.1). We show that a common variant polygenic risk significantly contributes to ID. The heritability explained by polygenic risk score is the highest for educational attainment (EDU) in mild ID (2.2%) but lower for more severe ID (0.6%). Finally, we identify a Finland enriched homozygote variant in the CRADD ID associated gene.Peer reviewe
    corecore