Complex diseases such as obesity and related co-morbidities are caused by a combination of underlying predisposing genetic and environmental factors. Genome-wide association studies (GWAS) have revealed complex trait-linked genetic variants with small effect sizes and enriched in non-coding regions, making translation into biological knowledge challenging. Epigenomic traits, such as DNA (CpG) methylation, can be used as a proxy to link genome and environment to phenotype and disease. Past epigenome-wide investigation efforts have mainly profiled bioavailable tissues (i.e. whole blood) using array-based methods that are biased towards CpG-dense regions such as promoters. However, complex trait-associated and tissue-specific CpGs have been found to be enriched in enhancers active in disease-relevant tissues. While whole-genome bisulfite sequencing enables full investigation of methylomes, its current high cost makes its applicability in large-scale epigenome-wide association studies (EWAS) impractical. We implemented a novel next-generation capture sequencing method - MethylC-Capture Sequencing, or MCC-Seq - that permits simultaneous and cost-efficient profiling of methylation and genotypes over user-defined genomic targets (up to 200Mb). We validated the accuracy of the method through technical comparisons with other available techniques. We developed two custom panels targeting up to ~4.5 million CpGs within the adipose-specific functional methylome and ~0.3 million SNPs from the Illumina HumanCore array. This allowed for downstream genotype imputations, thus making MCC-Seq a dual purpose next-generation sequencing method. Using deeply phenotyped population-based and clinical cohorts of visceral adipose tissue and whole blood, we applied MCC-Seq in over 500 samples and revealed unprecedented methylation variants linked to plasma lipid traits in multiple EWAS. We identified 567 lipid-linked regulatory regions and showed that these are enriched in adipose-specific enhancer regions, highlighting the need for an expanded catalog of interrogated distal regulatory regions in complex disease studies. We used the single-base profiling capacity of MCC-Seq to present novel localization patterns of metabolic trait-linked CpGs at regulatory regions and fine-map epigenetic signals from low-density coverage studies of almost 700 independent adipose samples. Through our efforts, we generated unique reference maps of methylome, transcriptome, and chromatin accessibility in the obesity-targeted visceral adipose tissue including isolated adipocytes. We applied integrational approaches using these maps and other ‘omics’ layers to show features of the identified trait-linked regions, highlighting cis-acting regulatory elements that depict putative pleiotropic effects on gene expression levels. We showed that a large proportion (>55%) of lipid-associated adipose regulatory regions are under genetic regulation, with this fraction being strengthened (>93%) at elements replicating in matched bioavailable tissues (i.e. whole blood samples). We further highlighted an enrichment for genetic regulation by GWAS SNPs of metabolic disease-linked traits, including at GALNT2. In all, the findings presented in this thesis show the advantage of using high-resolution epigenetic profiling in regulatory elements active in diseases-relevant tissues to provide novel genetic and epigenetic variants in large-scale studies of complex traits.Les maladies complexes telles que l’obésité et ses comorbidités associées sont causées par l’action commune de facteurs de prédispositions génétiques et environnementaux. Les études d’association pangénomiques (GWAS) ont permis d’identifier des facteurs génétiques communs associés à ces maladies, mais ayant une valeur prédictive limitée. De plus, due à leur localisation dans la portion non codante du génome, ceux-ci sont difficiles à lier aux mécanismes de la pathologie. Les changements épigénétiques, tel que la méthylation de l’ADN (CpG), peuvent être utilisés pour lier la génétique et l’environnement aux phénotypes et maladies complexes. Les études d’association panépigénomiques (EWAS) publiées jusqu’à maintenant ont plutôt profilé des tissus bio-disponibles (ex: sang complet) et employé des méthodes ciblant préférentiellement les régions promotrices du génome. Cependant, des études précédentes ont démontré que les CpGs associés aux traits complexes et spécifiques aux tissus sont enrichis dans les éléments activateurs de tissus liés aux maladies. De plus, le coût élevé du séquençage complet du méthylome (WGBS; whole-genome bisulfite sequencing) rend cette méthode difficilement applicable dans les EWAS à grande échelle. Nous avons implémenté une approche rentable pour la capture de séquençage de prochaine génération - MethylC-Capture Sequencing (MCC-Seq) - permettant de profiler simultanément le méthylome et le génome chevauchant des cibles définies par l’utilisateur (jusqu’à 200Mb). Nous avons validé le degré de précision de la méthode à travers des comparaisons de données de méthylation collectionnées utilisant des techniques établies. Nous avons développé deux panels de capture ciblant jusqu’à 4.5M de CpGs chevauchant le méthylome fonctionnel du tissu adipeux et 0.3M de variants génétiques compris sur le Illumina HumanCore array, permettant ainsi l’imputation de données génétiques additionnelles. Cela démontre que MCC-Seq est une méthode de séquençage à double usage. Utilisant des cohortes bien caractérisées de tissue adipeux viscéral (VAT) et de sang complet, nous avons appliqué MCC-Seq dans plusieurs EWAS permettant l’identification de nouveaux variants épigénomiques corrélés aux niveaux de lipides. Nous avons caractérisé 567 régions régulatrices liées à ces traits complexes étant enrichies parmi les éléments activateurs du tissu adipeux, démontrant ainsi l’utilité d’interroger ces régions régulatrices dans les études des maladies complexes. MCC-Seq a la capacité de profiler chaque base dans les régions capturées, nous permettant ainsi de présenter des motifs de localisation novateurs de variants épigénomiques liés aux traits complexes. De plus, cette méthode permet de cartographier les signaux épigénomiques identifiés par des études antérieures (~700 échantillons de tissu adipeux) ayant utilisé des techniques de profilage à couverture de faible densité. A travers nos études, nous avons généré des références uniques de cartes épigénomiques détaillant les profiles du méthylome, du transcriptome et d’accessibilité de la chromatine du VAT et adipocytes isolés. L’incorporation de ces cartes épigénomiques dans nos analyses nous a permis de caractériser nos régions régulatrices et d’identifier des effets pléiotropiques putatifs les liant à l’expression de gènes. Nous démontrons qu’une grande majorité des régions régulatrices associées aux lipides sont sous contrôle génétique (>55%) et que cette proportion était renforcée (>93%) aux sites répliqués dans des tissus bio-disponibles (ex: sang complet). De plus, nous constatons un enrichissement d’effets génétiques par des variants GWAS liés à des traits métaboliques complexes, incluant GALNT2. En résumé, les résultats présentés dans cette thèse démontrent les avantages de notre méthode pour l’évaluation exhaustive de la variation génétique et épigénétique dans des tissus biologiquement pertinents et leur impact dans la pathologie des maladies complexes
Is data on this page outdated, violates copyrights or anything else? Report the problem now and we will take corresponding actions after reviewing your request.