749 research outputs found
Contribution au développement d'approches statistiques en vue d'identifier des gènes affectant des caractères complexes ayant un intérêt médical ou agronomique.
La plupart des caractères ayant un intérêt médical ou agronomique sont dits complexes. Ce qui signifie qu'ilssont influencés par plusieurs gènes, des facteurs environnementaux et des interactions gènes-environnement.L'identification de gènes affectant de tels caractères est un des sujets les plus importants de la génétique moderne: d'un point vu médical, cela offrirait de nouvelles perspectives, tant d'ordre diagnostic quethérapeutique, tandis que sur un plan agronomique, cela ouvrirait de nouvelles voies dans la sélection et la manipulation des animaux domestiques.L'approche la plus efficace pour identifier des gènes impliqués dans des caractères complexes est le clonagepositionnel. Cette approche comporte trois étapes: (i) identifier les régions génomiques contenant les facteursgénétiques impliqués dans les caractères étudiés, (ii) identifier les mutations causales (iii) et enfin étudier lefonctionnement cellulaire et moléculaire des gènes responsables.La première étape du clonage positionnel, appelé cartographie génétique consiste à regarder au sein d'un groupe d'individus, s’il existe une corrélation entre l'histoire des différents chromosomes et celle du caractère étudié. Les outils génétiques permettant de suivre l'état d'un chromosome chez un individu, ont connu ces dernières années des progrès remarquables, notamment grâce à l'apparition des plates-formes de génotypage à haut débit et audéveloppement de nouveaux marqueurs génétiques. Actuellement, la principale difficulté en cartographie génétique réside dans le choix de la meilleure stratégie pour détecter des variations génétiques affectant des caractères complexes, qui le plus souvent sont associés à des effets relativement modestes. Le choix d'une approche dépendra: (i) du caractère étudié – caractère discret ou continu (ii) du dataset – les individus sontapparentés ou non et (iii) des outils génétiques disponibles.Les travaux réalisés au cours de cette thèse s'inscrivent précisément dans cette problématique, c'est à diredévelopper des approches statistiques afin d'identifier des gènes affectant des caractères complexes ayant unintérêt médical ou agronomique.La plupart des études de cartographie QTL (Quantitative Trait Loci, loci influençant un caractère continu), dansdes populations de bovins laitiers, exploitent la structure en GDD (Grand Daughter Design) des pedigrees etprocèdent en regardant au sein de familles de demi-frères paternelles, s’il existe des différences phénotypiquesentre les taureaux en fonction de l'homologue reçu. Étant donné que ce type d'approche exploite la transmissionde chromosome de taureau à taureau et que le chromosome X est d'origine maternelle chez les mâles, lacartographie de QTL sur le chromosome X dans ce type d'espèce a longtemps été exclue. Pour cartographier desQTL sur le X, nous avons proposé une approche retraçant l'histoire des différents segments chromosomiquesdans notre échantillon, sur base de son mode de transmission et de la structure de la population. Cette approchesuppose que s’il existe un QTL au niveau d'une région donnée, deux individus ayant reçu le même segmentchromosomique se ressembleront davantage que deux individus ayant reçu deux segments chromosomiquesdifférents. Cette approche suppose également qu'il existe une corrélation, appelée déséquilibre de liaison (DL)entre les allèles QTL et allèles marqueurs. Afin d'évaluer l'intérêt d'une telle approche, nous avons caractérisé les niveaux de DL sur le X. Nous avons montré que le X exhibait dans ce type de population des niveaux de DLparticulièrement élevé et inattendu. Parmi les 48 caractères laitiers étudiés, nous avons trouvé en utilisant une méthode de type maximum de vraisemblance restreint (REML, Residual maximum likelihood estimation) 5 QTLsignificatifs sur le X.Au cours de ces dernières années, le nombre de publications chez les espèces de productions mettant en évidencede l'empreinte parentale (y compris chez les oiseaux) comme étant associé aux QTL découverts (imprinted QTL,l'effet d'un allèle QTL dépendra de son origine parentale) n'a cessé de croitre. Ces résultats contredisent ceux de la biologie moléculaire, qui montrent que l'empreinte parentale est un phénomène rare et uniquement observéchez les mammifères placentaires. Une précédente étude, pointe le problème d'ordre statistique soulevé partoutes ces études détectant de l'empreinte parentale de façon quasi systématique. Ces études emploient un design de type line-cross qui suppose, pour cartographier des QTL et tester une hypothèse d'empreinte parentale, d'uncoté que les lignées parentales sont fixées pour les allèles QTL et de l'autre qu'elles peuvent ségréger pourdifférents allèles marqueurs. Si cette hypothèse est fausse et que les lignées parentales ne sont pas fixées pour lesallèles QTL, tous les individus en F1 ne sont pas hétérozygotes ou pas hétérozygotes pour les mêmes allèlesQTL. Si le nombre de parents en F1 est restreint (cas typique du coté paternel), il sera possible d'avoir un effet de substitution allélique qui dépendra de l'origine parentale en F2 et de conclure erronément à de l'empreinteparentale. Dans notre étude, nous avons montré que ce problème pouvait être exacerbé de 40 à 80% en cas deDL. Pour tester une hypothèse d'empreinte parentale, il faut que les parents en F1 soient hétérozygotes pour des allèles marqueurs différents. En cas de DL la probabilité que des allèles marqueurs différents soient associés àdes allèles QTL augmente et la détection de fausse empreinte parentale également.Depuis 2007, le nombre de loci à risque associés à des maladies complexes humaines et découverts dans desétudes d'association génome-entier (GWAS = Genome Wide Association Study n'a cessé de croire. Beaucoup de ces loci tombent dans des régions non-codantes et une hypothèse avancée pour expliquer leur rôle biologique est qu'ils moduleraient le niveau d'expression de certains gènes à travers des éléments cis. Des investigations combinant des études d'expression sur un grand nombre de gènes avec des études GWA ont été mises en œuvreafin de répertorier dans des bases de données les effets trans et cis de polymorphismes (appelés eQTL pourExpression Quantitative Trait Locus) sur le niveau d'expression de ces gènes. En utilisant ces bases de donnéesd'eQTL, nous avons pu découvrir: (i) des SNP à risque pour la maladie de Crohn et présent dans une régiondépourvue de gène, régulaient probablement le niveau d'expression du gène PTGER4 (protaglandin E receptor4), codant pour un récepteur à une prostaglandine et candidat sérieux à ce type désordre. (ii) Parmi les 39 SNPs àrisque dans la maladie, on observe 5 effets de type cis eQTL, non dus au hasard. Ces effets eQTL ouvrent denouvelles perspectives dans l'architecture génétique d'une maladie complexe: la maladie de Crohn.L'intensité des recombinaisons ainsi que leur position dans le génome sont dictées par le rôle fondamental quejoue la recombinaison dans la ségrégation correcte des chromosomes lors de la première division méiotique.Néanmoins, on observe, des différences entre individus de même sexe et de même âge aussi bien dans l'intensitéque dans la position des recombinaisons. Une idée pour explorer les causes génétiques sous-tendant cesvariations est d'appliquer des méthodes de cartographie QTL classique à la recombinaison elle-même, qui seratraitée comme un phénotype quantitatif. Nous avons réalisé ce type d'étude à différente échelle, sur unepopulation de taureaux laitiers génotypés pour des milliers de marqueurs de type SNP, en exploitant le fait: (i)qu'un grand nombre d'entre eux disposent d'un nombre suffisant de descendants pour estimer précisément leurtaux de recombinaison, (ii) qu'ils appartiennent à des familles de demi-frères paternelles, pour employer desméthodes de cartographie QTL exploitant le DL et la liaison génétique. Dans cette étude, nous caractérisonspréalablement les niveaux de recombinaison sur différentes échelles: (i) distribution du phénotype, (ii)répétabilité du caractère (iii) suivi d'une étude d'héritabilité. Nous montrons que plusieurs QTL affectent demanière significative les taux de recombinaisons et cela à différentes échelles.Plusieurs conclusions peuvent être tirées de ces études de cartographie génétiques tentant d'identifier des gènes influençant des caractères complexes d'intérêt agronomique ou médical.D'un point vu statistique, on montre que dans la plupart des cas les loci identifiés représentent une faible part de la variation génétique totale (10-15%). Plusieurs hypothèses sont avancées pour expliquer la variation génétiquerestante. (i) La première est que les études actuelles ne sont pas suffisamment puissantes pour détecter des loci même associés à des effets moyens. Cette faiblesse est illustrée par le fait qu'en réalisant une GWAS, dans laquelle on regroupe les données de GWAS individuelles, on augmente considérablement la puissance dedétection de loci associés au caractère étudié. (ii) Une autre hypothèse est que les études de cartographieactuelles utilisent des outils génétiques qui ciblent un seul type de polymorphismes: des variations génétiques fréquentes dans la population. Or un caractère complexe peut très bien être influencé par des variations génétiques peu fréquentes dans la population, voire des mutations rares ou encore des polymorphismesstructuraux (p.e: CNV: Copy Number Variant). (iii) La plupart des études actuelles ne recherchent que des effetsde type additif. Il est fort probable qu'il existe des effets de type gène-gène, appelés épistasie, qui affectent des caractères complexes. Cependant, détecter de tels effets nécessite de mettre en œuvre des études beaucoup pluspuissantes que celles existantes actuellement.D'un point vu biologique, si certains loci détectés se trouvent dans des gènes dont on connait le rôle dans lecaractère étudié, beaucoup d'entre eux se trouvent dans des régions non-codantes. Ce résultat n'a rien desurprenant quand on sait que seulement 5 % du génome est conservé et donc fonctionnel et que parmi ces 5%, untiers correspond à des gènes. Toutefois, comprendre le rôle biologique de ces loci dans des caractères complexesest un challenge. Une hypothèse avancée est que le niveau d'expression de certains gènes est peut-être régulé parces polymorphismes influençant des caractères complexes.Pour améliorer nos connaissances sur les caractères complexes, il sera nécessaire, au cours des prochainesannées:(i) d'étendre le design des études génétiques afin d'en augmenter leur puissance de détection. Cecipassera notamment par: (1) une augmentation de la taille des échantillons, (2) étudier le même phénotype dans des populations ayant une origine différente (un polymorphisme, ayant le même effet dans deux populations différentes peut être plus facilement détecté dans la population où il est le plus fréquent), (3) améliorer la précision de l'estimation des phénotypes (4) étudier des phénotypes apparentés ou des sous-phénotypes (p.e.Crohn et les colites ulcéro-hémorragiques) (5) s'intéresser davantage aux facteurs environnementaux.(ii) Il faudra également étendre la palette des outils génétiques disponibles, pour rechercher despolymorphismes peu fréquents ou des polymorphismes structuraux pouvant affecter des caractères complexes.Ceci devrait être prochainement réalisable grâce à l'essor des technologies de séquençage à haut débit qui devrait permettre de cataloguer des polymorphismes avec une fréquence > 1% dans une population (1000 GenomeProject).On peut penser également qu'il sera possible dans quelques années de séquencer complètement tous les individus d'une étude de cartographie et d'identifier ainsi des mutations génétiques rares. Néanmoins, ces nouveaux outils génétiques bouleverseront les méthodes de cartographie génétique actuelles. Les approches futures devrontexploiter toute l'information disponible simultanément, c'est-à-dire combiner l'information concernant toutes lesvariations génétiques possibles ainsi que les phénotypes et d'éventuels effets environnementaux.En génétique animale, le problème des loci influençant un caractère complexe et écartés par manque de puissance statistique a été contourné par une approche dite de sélection génomique. Celle-ci a pour but de prendre en compte les signaux d’association sur l’entièreté du génome, indépendamment des seuils de signification associés, et de les intégrer en une prédiction la plus précise possible de la valeur d’élevage d’un individu. L’objectif passe donc de l’identification la plus précise possible de loci individuels à la prédiction la plus précise possible d’une valeur d’élevage individuelle globale, sans nécessairement savoir exactement quels sont les loci qui y contribuent, mais en intégrant plutôt de façon pondérée sur l’ensemble des possibilités.Or il serait tout à fait imaginable d'adapter ce type d'approche à des maladies complexes humaines et dedéterminer à partir d'une GWAS un « risque relatif génome entier » (GWRR) pour chaque individu
Diverse type 2 diabetes genetic risk factors functionally converge in a phenotype-focused gene network
Type 2 Diabetes (T2D) constitutes a global health burden. Efforts to uncover predisposing genetic variation have been considerable, yet detailed knowledge of the underlying pathogenesis remains poor. Here, we constructed a T2D phenotypic-linkage network (T2D-PLN), by integrating diverse gene functional information that highlight genes, which when disrupted in mice, elicit similar T2D-relevant phenotypes. Sensitising the network to T2D-relevant phenotypes enabled significant functional convergence to be detected between genes implicated in monogenic or syndromic diabetes and genes lying within genomic regions associated with T2D common risk. We extended these analyses to a recent multiethnic T2D case-control exome of 12,940 individuals that found no evidence of T2D risk association for rare frequency variants outside of previously known T2D risk loci. Examining associations involving protein-truncating variants (PTV), most at low population frequencies, the T2D-PLN was able to identify a convergent set of biological pathways that were perturbed within four of five independent T2D case/control ethnic sets of 2000 to 5000 exomes each. These same pathways were found to be over-represented among both known monogenic or syndromic diabetes genes and genes within T2D-associated common risk loci. Our study demonstrates convergent biology amongst variants representing different classes of T2D genetic risk. Although convergence was observed at the pathway level, few of the contributing genes were found in common between different cohorts or variant classes, most notably between the exome variant sets which suggests that future rare variant studies may be better focusing their power onto a single population of recent common ancestry
Nitric Oxide Synthases and Atrial Fibrillation
Oxidative stress has been implicated in the pathogenesis of atrial fibrillation. There are multiple systems in the myocardium which contribute to redox homeostasis, and loss of homeostasis can result in oxidative stress. Potential sources of oxidants include nitric oxide synthases (NOS), which normally produce nitric oxide in the heart. Two NOS isoforms (1 and 3) are normally expressed in the heart. During pathologies such as heart failure, there is induction of NOS 2 in multiple cell types in the myocardium. In certain conditions, the NOS enzymes may become uncoupled, shifting from production of nitric oxide to superoxide anion, a potent free radical and oxidant. Multiple lines of evidence suggest a role for NOS in the pathogenesis of atrial fibrillation. Therapeutic approaches to reduce atrial fibrillation by modulation of NOS activity may be beneficial, although further investigation of this strategy is needed
Deep phenotyping for precision medicine in Parkinson's disease
A major challenge in medical genomics is to understand why individuals with the same disorder have different clinical symptoms and why those who carry the same mutation may be affected by different disorders. In every complex disorder, identifying the contribution of different genetic and non-genetic risk factors is a key obstacle to understanding disease mechanisms. Genetic studies rely on precise phenotypes and are unable to uncover the genetic contributions to a disorder when phenotypes are imprecise. To address this challenge, deeply phenotyped cohorts have been developed for which detailed, fine-grained data have been collected. These cohorts help us to investigate the underlying biological pathways and risk factors to identify treatment targets, and thus to advance precision medicine. The neurodegenerative disorder Parkinson's disease has a diverse phenotypical presentation and modest heritability, and its underlying disease mechanisms are still being debated. As such, considerable efforts have been made to develop deeply phenotyped cohorts for this disorder. Here, we focus on Parkinson's disease and explore how deep phenotyping can help address the challenges raised by genetic and phenotypic heterogeneity. We also discuss recent methods for data collection and computation, as well as methodological challenges that have to be overcome
Digital outcome measures from smartwatch data relate to non-motor features of Parkinson’s disease
Monitoring of Parkinson’s disease (PD) has seen substantial improvement over recent years as digital sensors enable a passive and continuous collection of information in the home environment. However, the primary focus of this work has been motor symptoms, with little focus on the non-motor aspects of the disease. To address this, we combined longitudinal clinical non-motor assessment data and digital multi-sensor data from the Verily Study Watch for 149 participants from the Parkinson’s Progression Monitoring Initiative (PPMI) cohort with a diagnosis of PD. We show that digitally collected physical activity and sleep measures significantly relate to clinical non-motor assessments of cognitive, autonomic, and daily living impairment. However, the poor predictive performance we observed, highlights the need for better targeted digital outcome measures to enable monitoring of non-motor symptoms
Wearable movement-tracking data identify Parkinson's disease years before clinical diagnosis
Parkinson’s disease is a progressive neurodegenerative movement disorder with a long latent phase and currently no disease-modifying treatments. Reliable predictive biomarkers that could transform efforts to develop neuroprotective treatments remain to be identified. Using UK Biobank, we investigated the predictive value of accelerometry in identifying prodromal Parkinson’s disease in the general population and compared this digital biomarker with models based on genetics, lifestyle, blood biochemistry or prodromal symptoms data. Machine learning models trained using accelerometry data achieved better test performance in distinguishing both clinically diagnosed Parkinson’s disease (n = 153) (area under precision recall curve (AUPRC) 0.14 ± 0.04) and prodromal Parkinson’s disease (n = 113) up to 7 years pre-diagnosis (AUPRC 0.07 ± 0.03) from the general population (n = 33,009) compared with all other modalities tested (genetics: AUPRC = 0.01 ± 0.00, P = 2.2 × 10−3; lifestyle: AUPRC = 0.03 ± 0.04, P = 2.5 × 10−3; blood biochemistry: AUPRC = 0.01 ± 0.00, P = 4.1 × 10−3; prodromal signs: AUPRC = 0.01 ± 0.00, P = 3.6 × 10−3). Accelerometry is a potentially important, low-cost screening tool for determining people at risk of developing Parkinson’s disease and identifying participants for clinical trials of neuroprotective treatments
Clinical and genotypic analysis in determining dystonia non-motor phenotypic heterogeneity: a UK Biobank study
The spectrum of non-motor symptoms in dystonia remains unclear. Using UK Biobank data, we analysed clinical phenotypic and genetic information in the largest dystonia cohort reported to date. Case–control comparison of dystonia and matched control cohort was undertaken to identify domains (psychiatric, pain, sleep and cognition) of increased symptom burden in dystonia. Whole exome data were used to determine the rate and likely pathogenicity of variants in Mendelian inherited dystonia causing genes and linked to clinical data. Within the dystonia cohort, phenotypic and genetic single-nucleotide polymorphism (SNP) data were combined in a mixed model analysis to derive genetically informed phenotypic axes. A total of 1572 individuals with dystonia were identified, including cervical dystonia (n = 775), blepharospasm (n = 131), tremor (n = 488) and dystonia, unspecified (n = 154) groups. Phenotypic patterns highlighted a predominance of psychiatric symptoms (anxiety and depression), excess pain and sleep disturbance. Cognitive impairment was limited to prospective memory and fluid intelligence. Whole exome sequencing identified 798 loss of function variants in dystonia-linked genes, 67 missense variants (MPC > 3) and 305 other forms of non-synonymous variants (including inframe deletion, inframe insertion, stop loss and start loss variants). A single loss of function variant (ANO3) was identified in the dystonia cohort. Combined SNP and clinical data identified multiple genetically informed phenotypic axes with predominance of psychiatric, pain and sleep non-motor domains. An excess of psychiatric, pain and sleep symptoms were evident across all forms of dystonia. Combination with genetic data highlights phenotypic subgroups consistent with the heterogeneity observed in clinical practice
Macro- and micro-structural Insights into primary dystonia A UK Biobank study
Background
Dystonia is a hyperkinetic movement disorder with key motor network dysfunction implicated in pathophysiology. The UK Biobank encompasses > 500,000 participants, of whom 42,565 underwent brain MRI scanning. This study applied an optimized pre-processing pipeline, aimed at better accounting for artifact and improving data reliability, to assess for grey and white matter structural MRI changes between individuals diagnosed with primary dystonia and an unaffected control cohort.
Methods
Individuals with dystonia (n = 76) were identified from the UK Biobank using published algorithms, alongside an age- and sex-matched unaffected control cohort (n = 311). Grey matter morphometric and diffusion measures were assessed, together with white matter diffusion tensor and diffusion kurtosis metrics using tractography and tractometry. Post-hoc Neurite Orientation and Density Distribution Imaging (NODDI) was also undertaken for tracts in which significant differences were observed.
Results
Grey matter tremor-specific striatal differences were observed, with higher radial kurtosis. Tractography identified no white matter differences, however segmental tractometry identified localised differences, particularly in the superior cerebellar peduncles and anterior thalamic radiations, including higher fractional anisotropy and lower orientation distribution index in dystonia, compared to controls. Additional tremor-specific changes included lower neurite density index in the anterior thalamic radiations.
Conclusions
Analysis of imaging data from one of the largest dystonia cohorts to date demonstrates microstructural differences in cerebellar and thalamic white matter connections, with architectural differences such as less orientation dispersion potentially being a component of the morphological structural changes implicated in dystonia. Distinct tremor-related imaging features are also implicated in both grey and white matter
The genomic basis of mood instability:identification of 46 loci in 363,705 UK Biobank participants, genetic correlation with psychiatric disorders, and association with gene expression and function
Genome-wide association studies (GWAS) of psychiatric phenotypes have tended to focus on categorical diagnoses, but to understand the biology of mental illness it may be more useful to study traits which cut across traditional boundaries. Here, we report the results of a GWAS of mood instability as a trait in a large population cohort (UK Biobank, n = 363,705). We also assess the clinical and biological relevance of the findings, including whether genetic associations show enrichment for nervous system pathways. Forty six unique loci associated with mood instability were identified with a SNP heritability estimate of 9%. Linkage Disequilibrium Score Regression (LDSR) analyses identified genetic correlations with Major Depressive Disorder (MDD), Bipolar Disorder (BD), Schizophrenia, anxiety, and Post Traumatic Stress Disorder (PTSD). Gene-level and gene set analyses identified 244 significant genes and 6 enriched gene sets. Tissue expression analysis of the SNP-level data found enrichment in multiple brain regions, and eQTL analyses highlighted an inversion on chromosome 17 plus two brain-specific eQTLs. In addition, we used a Phenotype Linkage Network (PLN) analysis and community analysis to assess for enrichment of nervous system gene sets using mouse orthologue databases. The PLN analysis found enrichment in nervous system PLNs for a community containing serotonin and melatonin receptors. In summary, this work has identified novel loci, tissues and gene sets contributing to mood instability. These findings may be relevant for the identification of novel trans-diagnostic drug targets and could help to inform future stratified medicine innovations in mental health
Novel Crohn Disease Locus Identified by Genome-Wide Association Maps to a Gene Desert on 5p13.1 and Modulates Expression of PTGER4
To identify novel susceptibility loci for Crohn disease (CD), we undertook a genome-wide association study with more than 300,000 SNPs characterized in 547 patients and 928 controls. We found three chromosome regions that provided evidence of disease association with p-values between 10(−6) and 10(−9). Two of these (IL23R on Chromosome 1 and CARD15 on Chromosome 16) correspond to genes previously reported to be associated with CD. In addition, a 250-kb region of Chromosome 5p13.1 was found to contain multiple markers with strongly suggestive evidence of disease association (including four markers with p < 10(−7)). We replicated the results for 5p13.1 by studying 1,266 additional CD patients, 559 additional controls, and 428 trios. Significant evidence of association (p < 4 × 10(−4)) was found in case/control comparisons with the replication data, while associated alleles were over-transmitted to affected offspring (p < 0.05), thus confirming that the 5p13.1 locus contributes to CD susceptibility. The CD-associated 250-kb region was saturated with 111 SNP markers. Haplotype analysis supports a complex locus architecture with multiple variants contributing to disease susceptibility. The novel 5p13.1 CD locus is contained within a 1.25-Mb gene desert. We present evidence that disease-associated alleles correlate with quantitative expression levels of the prostaglandin receptor EP4, PTGER4, the gene that resides closest to the associated region. Our results identify a major new susceptibility locus for CD, and suggest that genetic variants associated with disease risk at this locus could modulate cis-acting regulatory elements of PTGER4
- …