20 research outputs found

    Modélisation de la composante génétique des maladies humaines : Données familiales et Modèles Mixtes

    No full text
    Linear mixed models have been formalized 60 years ago. These models allow to estimate fixed effects, as in the linear models, and random effects. First used in animal genetics, this type of modelling have been widely used in human genetics since a few years. Mixed models can be used in many genetic analysis; linkage and association studies, heritability estimations and Parent-of Origin effects studies for population or familial data.My thesis’ aim is to investigate mixed models based methods, for genetic data in population and, for familial genetic data.In the first part of my thesis, we investigated the mixed model statistical theory and their multiple uses in human genetics. We also adapted methods for our own work. An R package have been created which permits to analyze genetic data in R environment with mixed models.In a second part, we applied mixed models on Three-Cities data, a French longitudinal study, to estimate heritability of several traits. For this analysis, we have access to tag-SNPs typically used in genome-wide association studies, birthplaces and several anthropometric traits. The aim of our study is to analyze presence of population stratification and evaluate methods to correct it. In the one hand, we analyzed birthplace geographic coordinates and showed that the correction for population stratification by classical method is not sufficient in this case. In the other hand, we analyzed anthropometric traits, in particular the height for which we estimated heritability to 39% in Three-Cities study population.In the last part, we focused on family data. In a first work, we exploited familial information in causal variant research. In a second work, we explored mixed models uses for familial data, in particular association study, on Multiple Sclerosis data. We showed that mixed model methods can not be used without taking account the ascertainment scheme: in our data, all families have at least two affected sibs. To understand and correct this phenomenon, more investigations are needed.Le modèle linéaire mixte a été formalisé il y a plus de 60 ans. Celui-ci permet d'estimer un modèle avec des effets fixes équivalents à ceux du modèle linéaire classique et des effets aléatoires. Ce type de modélisation, d'abord utilisé en génétique animale, est depuis quelques années largement utilisé en génétique humaine. Les utilisations de ce modèle sont nombreuses. En effet, il peut être utilisé en étude de liaison, d'association, pour l'estimation de l'héritabilité ou encore dans la recherche d'empreinte parentale et peut s'adapter à des données familiales ou en population.Le but de mon doctorat est d'exploiter différentes méthodes basées sur les modèles mixtes d'abord sur des données génétiques en population puis sur des données génétiques familiales.Dans un premier temps, nous explorons dans ce manuscrit la théorie des modèles linéaires mixtes et leur utilisation en génétique. Nous adaptons aussi certaines méthodes pour les appliquer à notre recherche. Ce travail a donné lieu au développement informatique d'un package R permettant d'utiliser ces modèles dans le cadre des études génétiques.Dans un deuxième temps, nous utilisons les modèles linéaires mixtes pour l'estimation de l'héritabilité dans une étude en population française, l'étude Trois-Cités. Nous disposons dans cette étude des génotypes des tag-SNPs habituellement utilisés dans les études d'association ainsi que des lieux de naissance et de plusieurs traits anthropométriques quantitatifs tels que la taille. L'objectif est alors d'étudier la présence et la prise en compte dans l'analyse de stratification de population dans cette étude. Dans ce manuscrit, nous analysons les coordonnées géographiques des lieux de naissance. Nos résultats mettent en évidence la difficulté pour corriger correctement la stratification de population avec les méthodes classiques dans certains cas. Nous analysons ensuite les traits anthropométriques en particulier la taille dont nous estimons l'héritabilité à 39% dans la population de l'étude Trois-Cités.Dans la dernière partie de ce manuscrit, nous nous concentrons sur les données familiales. Nous montrons le gain d’information que peut apporter ce type de données dans la recherche des variants causaux. Puis, nous explorons l'utilisation des modèles mixtes sur des données familiales en appliquant certaines des méthodes associées dans la recherche de signaux d'association pour la Sclérose en Plaques, une maladie auto-immune, en utilisant un échantillon d’une centaine de familles nucléaires avec au moins deux germains atteints. Nous avons alors mis en évidence l’inadéquation des méthodes classiques basées sur les modèles mixtes à ce type de données. Afin de mieux comprendre ce biais de sélection et de le corriger, plus d’investigations sont nécessaires

    Modelisation of Genetic Risk in Human Diseases : Family Data and Mixed Model

    No full text
    Le modèle linéaire mixte a été formalisé il y a plus de 60 ans. Celui-ci permet d'estimer un modèle avec des effets fixes équivalents à ceux du modèle linéaire classique et des effets aléatoires. Ce type de modélisation, d'abord utilisé en génétique animale, est depuis quelques années largement utilisé en génétique humaine. Les utilisations de ce modèle sont nombreuses. En effet, il peut être utilisé en étude de liaison, d'association, pour l'estimation de l'héritabilité ou encore dans la recherche d'empreinte parentale et peut s'adapter à des données familiales ou en population.Le but de mon doctorat est d'exploiter différentes méthodes basées sur les modèles mixtes d'abord sur des données génétiques en population puis sur des données génétiques familiales.Dans un premier temps, nous explorons dans ce manuscrit la théorie des modèles linéaires mixtes et leur utilisation en génétique. Nous adaptons aussi certaines méthodes pour les appliquer à notre recherche. Ce travail a donné lieu au développement informatique d'un package R permettant d'utiliser ces modèles dans le cadre des études génétiques.Dans un deuxième temps, nous utilisons les modèles linéaires mixtes pour l'estimation de l'héritabilité dans une étude en population française, l'étude Trois-Cités. Nous disposons dans cette étude des génotypes des tag-SNPs habituellement utilisés dans les études d'association ainsi que des lieux de naissance et de plusieurs traits anthropométriques quantitatifs tels que la taille. L'objectif est alors d'étudier la présence et la prise en compte dans l'analyse de stratification de population dans cette étude. Dans ce manuscrit, nous analysons les coordonnées géographiques des lieux de naissance. Nos résultats mettent en évidence la difficulté pour corriger correctement la stratification de population avec les méthodes classiques dans certains cas. Nous analysons ensuite les traits anthropométriques en particulier la taille dont nous estimons l'héritabilité à 39% dans la population de l'étude Trois-Cités.Dans la dernière partie de ce manuscrit, nous nous concentrons sur les données familiales. Nous montrons le gain d’information que peut apporter ce type de données dans la recherche des variants causaux. Puis, nous explorons l'utilisation des modèles mixtes sur des données familiales en appliquant certaines des méthodes associées dans la recherche de signaux d'association pour la Sclérose en Plaques, une maladie auto-immune, en utilisant un échantillon d’une centaine de familles nucléaires avec au moins deux germains atteints. Nous avons alors mis en évidence l’inadéquation des méthodes classiques basées sur les modèles mixtes à ce type de données. Afin de mieux comprendre ce biais de sélection et de le corriger, plus d’investigations sont nécessaires.Linear mixed models have been formalized 60 years ago. These models allow to estimate fixed effects, as in the linear models, and random effects. First used in animal genetics, this type of modelling have been widely used in human genetics since a few years. Mixed models can be used in many genetic analysis; linkage and association studies, heritability estimations and Parent-of Origin effects studies for population or familial data.My thesis’ aim is to investigate mixed models based methods, for genetic data in population and, for familial genetic data.In the first part of my thesis, we investigated the mixed model statistical theory and their multiple uses in human genetics. We also adapted methods for our own work. An R package have been created which permits to analyze genetic data in R environment with mixed models.In a second part, we applied mixed models on Three-Cities data, a French longitudinal study, to estimate heritability of several traits. For this analysis, we have access to tag-SNPs typically used in genome-wide association studies, birthplaces and several anthropometric traits. The aim of our study is to analyze presence of population stratification and evaluate methods to correct it. In the one hand, we analyzed birthplace geographic coordinates and showed that the correction for population stratification by classical method is not sufficient in this case. In the other hand, we analyzed anthropometric traits, in particular the height for which we estimated heritability to 39% in Three-Cities study population.In the last part, we focused on family data. In a first work, we exploited familial information in causal variant research. In a second work, we explored mixed models uses for familial data, in particular association study, on Multiple Sclerosis data. We showed that mixed model methods can not be used without taking account the ascertainment scheme: in our data, all families have at least two affected sibs. To understand and correct this phenomenon, more investigations are needed

    Modélisation de la composante génétique des maladies humaines : Données familiales et Modèles Mixtes

    No full text
    Linear mixed models have been formalized 60 years ago. These models allow to estimate fixed effects, as in the linear models, and random effects. First used in animal genetics, this type of modelling have been widely used in human genetics since a few years. Mixed models can be used in many genetic analysis; linkage and association studies, heritability estimations and Parent-of Origin effects studies for population or familial data.My thesis’ aim is to investigate mixed models based methods, for genetic data in population and, for familial genetic data.In the first part of my thesis, we investigated the mixed model statistical theory and their multiple uses in human genetics. We also adapted methods for our own work. An R package have been created which permits to analyze genetic data in R environment with mixed models.In a second part, we applied mixed models on Three-Cities data, a French longitudinal study, to estimate heritability of several traits. For this analysis, we have access to tag-SNPs typically used in genome-wide association studies, birthplaces and several anthropometric traits. The aim of our study is to analyze presence of population stratification and evaluate methods to correct it. In the one hand, we analyzed birthplace geographic coordinates and showed that the correction for population stratification by classical method is not sufficient in this case. In the other hand, we analyzed anthropometric traits, in particular the height for which we estimated heritability to 39% in Three-Cities study population.In the last part, we focused on family data. In a first work, we exploited familial information in causal variant research. In a second work, we explored mixed models uses for familial data, in particular association study, on Multiple Sclerosis data. We showed that mixed model methods can not be used without taking account the ascertainment scheme: in our data, all families have at least two affected sibs. To understand and correct this phenomenon, more investigations are needed.Le modèle linéaire mixte a été formalisé il y a plus de 60 ans. Celui-ci permet d'estimer un modèle avec des effets fixes équivalents à ceux du modèle linéaire classique et des effets aléatoires. Ce type de modélisation, d'abord utilisé en génétique animale, est depuis quelques années largement utilisé en génétique humaine. Les utilisations de ce modèle sont nombreuses. En effet, il peut être utilisé en étude de liaison, d'association, pour l'estimation de l'héritabilité ou encore dans la recherche d'empreinte parentale et peut s'adapter à des données familiales ou en population.Le but de mon doctorat est d'exploiter différentes méthodes basées sur les modèles mixtes d'abord sur des données génétiques en population puis sur des données génétiques familiales.Dans un premier temps, nous explorons dans ce manuscrit la théorie des modèles linéaires mixtes et leur utilisation en génétique. Nous adaptons aussi certaines méthodes pour les appliquer à notre recherche. Ce travail a donné lieu au développement informatique d'un package R permettant d'utiliser ces modèles dans le cadre des études génétiques.Dans un deuxième temps, nous utilisons les modèles linéaires mixtes pour l'estimation de l'héritabilité dans une étude en population française, l'étude Trois-Cités. Nous disposons dans cette étude des génotypes des tag-SNPs habituellement utilisés dans les études d'association ainsi que des lieux de naissance et de plusieurs traits anthropométriques quantitatifs tels que la taille. L'objectif est alors d'étudier la présence et la prise en compte dans l'analyse de stratification de population dans cette étude. Dans ce manuscrit, nous analysons les coordonnées géographiques des lieux de naissance. Nos résultats mettent en évidence la difficulté pour corriger correctement la stratification de population avec les méthodes classiques dans certains cas. Nous analysons ensuite les traits anthropométriques en particulier la taille dont nous estimons l'héritabilité à 39% dans la population de l'étude Trois-Cités.Dans la dernière partie de ce manuscrit, nous nous concentrons sur les données familiales. Nous montrons le gain d’information que peut apporter ce type de données dans la recherche des variants causaux. Puis, nous explorons l'utilisation des modèles mixtes sur des données familiales en appliquant certaines des méthodes associées dans la recherche de signaux d'association pour la Sclérose en Plaques, une maladie auto-immune, en utilisant un échantillon d’une centaine de familles nucléaires avec au moins deux germains atteints. Nous avons alors mis en évidence l’inadéquation des méthodes classiques basées sur les modèles mixtes à ce type de données. Afin de mieux comprendre ce biais de sélection et de le corriger, plus d’investigations sont nécessaires

    Genomic evidence for MHC disassortative mating in humans

    No full text
    International audienc

    Exploring the link between additive heritability and prediction accuracy from a ridge regression perspective

    No full text
    International audienceGenome-Wide Association Studies (GWAS) explain only a small fraction of heritability for most complex human phenotypes. Genomic heritability estimates the variance explained by the SNPs on the whole genome using mixed models and accounts for the many small contributions of SNPs in the explanation of a phenotype. This paper approaches heritability from a machine learning perspective, and examines the close link between mixed models and ridge regression. Our contribution is two-fold. First, we propose estimating genomic heritability using a predictive approach via ridge regression and Generalized Cross Validation (GCV). We show that this is consistent with classical mixed model based estimation. Second, we derive simple formulae that express prediction accuracy as a function of the ratio np , where n is the population size and p the total number of SNPs. These formulae clearly show that a high heritability does not imply an accurate prediction when p > n. Both the estimation of heritability via GCV and the prediction accuracy formulae are validated using simulated data and real data from UK Biobank

    A study of feasibility for genome-wide haplotype association of complex traits in imaging genetics

    No full text
    International audienceImaging-genetics cohorts allow to find associations between genotyped variants and brain imaging features. They are invaluable tools to evaluate the part of genetics and environment in the brain characteristic variance observed in normal and pathological populations. The present analyses were conducted using the 2018 UK Biobank (UKB) data release, and included 15,040 subjects for which sulcal opening, a measure of sulcus width, are extracted for 126 sulci using BrainVisa/Morphologist pipeline. Based on genetic maps, continuous blocks of high-confidence phase are extracted using the haplotype dataset of UK Biobank. The feasibility study analyzes 13,942 haplotypes of 1,756 blocks on chromosome 21, obtained with a stringent block definition, and shows that block-based test seems underpowered compared to haplotype-based association test

    Genome-wide haplotype association study in imaging genetics using whole-brain sulcal openings of 16,304 UK Biobank subjects

    No full text
    International audienceNeuroimaging-genetics cohorts gather two types of data: brain imaging and genetic data. They allow the discovery of associations between genetic variants and brain imaging features. They are invaluable resources to study the influence of genetics and environment in the brain features variance observed in normal and pathological populations. This study presents a genome-wide haplotype analysis for 123 brain sulcus opening value (a measure of sulcal width) across the whole brain that include 16,304 subjects from UK Biobank. Using genetic maps, we defined 119,548 blocks of low recombination rate distributed along the 22 autosomal chromosomes and analyzed 1,051,316 haplotypes. To test associations between haplotypes and complex traits, we designed three statistical approaches. Two of them use a model that includes all the haplotypes for a single block, while the last approach considers each haplotype independently. All the statistics produced were assessed as rigorously as possible. Thanks to the rich imaging dataset at hand, we used resampling techniques to assess False Positive Rate for each statistical approach in a genome-wide and brain-wide context. The results on real data show that genome-wide haplotype analyses are more sensitive than single-SNP approach and account for local complex Linkage Disequilibrium (LD) structure, which makes genome-wide haplotype analysis an interesting and statistically sound alternative to the single-SNP counterpart

    Shared Heritability of Blood Pressure and Pulse Wave Velocity: Insights From the STANISLAS Cohort

    No full text
    Background: Pulse wave velocity (PWV) is a marker of arterial stiffness, which is intrinsically highly correlated with blood pressure (BP). However, the interplay of PWV and BP heritability has not been extensively studied. This study aimed to estimate the heritability of PWV and BP and determine the genetic correlation between PWV and BP. Methods: The heritability of PWV and BP was estimated in 1080 subjects from the STANISLAS (Suivi Temporaire Annuel Non-Invasif de la Santé des Lorrains Assurés Sociaux) cohort with at least one relative using a linear mixed model within one frequentist and one Bayesian framework implemented, respectively, in the Gaston and MCMCglmm R packages. Then their genetic correlations were also estimated. Results: The heritability estimations for PWV were within the same range of the heritability of systolic BP and diastolic BP (23%, 19%, and 27%, respectively). Daytime heritability of BP was higher than nighttime BP. In addition, phenotypic correlations between PWV and systolic BP/diastolic BP were, respectively, 0.34 and 0.23, whereas nonsignificant genetic correlations were 0.08 and 0.22 respectively, indicating that PWV and diastolic BP shared more polygenic codeterminants than PWV and systolic BP. Conclusions: Our results suggest that the heritability of PWV is >20% and within the same range as BP heritability. It also suggests that the link between PWV and BP goes beyond phenotypic association: PWV and BP (in particular diastolic BP) share common genetic determinants. This genetic interdependence of PWV and BP appears largely polygenic

    Layer myocardial strain is the most heritable echocardiographic trait

    No full text
    Abstract Aims Myocardial deformation assessed by strain analysis represents a significant advancement in our assessment of cardiac mechanics. However, whether this variable is genetically heritable or whether all/most of its variability is related to environmental factors is currently unknown. We sought to determine the heritability of echocardiographically determined cardiac mechanics indices in a population setting. Methods and results A total of 1357 initially healthy subjects (women 51.6%; 48.2 ± 14.1 years) were included in this study from 20-year follow-up after the fourth visit of the longitudinal familial STANISLAS cohort (Lorraine, France). Data were acquired using state-of-the-art cardiac ultrasound equipment, using acquisition and measurement protocols recommended by the EACVI (European Association of Cardiovascular Imaging)/ASE (American Society of Echocardiography)/Industry Task Force. Layer-specific global longitudinal strain (GLS) and global circumferential strain (full-wall, subendocardial, and subepicardial) and conventional structural and functional cardiac parameters and their potential heritability were assessed using restricted maximum likelihood analysis, with genetic relatedness matrix calculated from genome-wide association data. Indices of longitudinal/circumferential myocardial function and left ventricular (LV) ejection fraction had low heritability (ranging from 10% to 20%). Diastolic and standard LV function parameters had moderate heritability (ranging from 20% to 30%) except for end-systolic and end-diastolic volumes (30% and 45%, respectively). In contrast, global longitudinal subendocardial strain (GLSEndo)/global longitudinal subepicardial strain (GLSEpi) ratio had a high level of heritability (65%). Except for GLSEndo/GLSEpi ratio, a large percentage of variance remained unexplained (&amp;gt;50%). Conclusions In our population cohort, GLSEndo/GLSEpi ratio had a high level of heritability, whereas other classical and mechanical LV function parameters did not. Given the increasing recognition of GLSEndo/GLSEpi ratio as an early/sensitive imaging biomarker of systolic dysfunction, our results suggest the possible existence of individual genetic predispositions to myocardial decline. </jats:sec
    corecore