Genetic contribution to the aggregation of schizophrenia and bipolar disorder in multiplex consanguineous Pakistani pedigrees

Abstract

La schizophrénie (SCZ) et le trouble bipolaire (TB) sont des troubles mentaux graves qui présentent tous deux des symptômes affectifs et psychotiques. La SCZ est un trouble psychotique primaire caractérisé par des symptômes d’idées délirantes et d’hallucinations. Le TB est principalement un trouble de l'humeur primaire défini des périodes de manie et de dépression. En 2010, ces troubles contribuaient respectivement à 7,4% et 7,0% de la charge mondiale de morbidité. La prévalence élevée (~ 0,4% pour la SCZ et ~ 2,4% pour le TB) et la forte héritabilité estimée (~ 80%) suggèrent toutes deux une forte influence génétique. Les données disponibles démontrent qu'il existe des chevauchements génétiques entre les deux conditions, mais également des composantes génétiques spécifiques à chaque maladie. Au cours de la dernière décennie, des études d’association pan-génomiques ont identifié des centaines de loci génétiques associés à ces maladies. De plus, d’autres méthodes ont permis de mettre en relief la contribution d’autres types de variations génétiques comme les rares variations du nombre de copies (CNV), de rares polymorphismes de nucléotide simple (SNV) et des mutations de novo (MDN). Bien que notre connaissance de l'architecture génétique de ces conditions est en progression, une grande partie de l'héritabilité demeure toujours non résolue et inexpliquée. Une longue histoire de faible mélange génétique combiné à la pratique répandue de mariages consanguins (50% des unions sont consanguines) rend les familles pakistanaises prometteuses pour des études génétiques médicales basées sur la population. Des études épidémiologiques ont démontré que la consanguinité est associée à un risque accru de nombreux traits. L’étude de familles a largement été appliquée dans la cartographie génétique des caractères mendéliens et complexes. Cependant, peu d’études ont eu recours à de grandes familles consanguines multiplexes pour étudier en profondeur le rôle de la consanguinité dans les troubles neuropsychiatriques tels que la SCZ et le TB. Les CNVs ont été impliquées dans la SCZ et le TB depuis la découverte des délétions 22q11.2. Malgré que ces derniers soient rares dans la population, ils contribuent de manière significative au risque. Des études d'association de CNV ont révélé un enrichissement de délétions et de duplications rares et un taux plus élevé de CNV de novo dans les cas relatifs aux témoins. De plus, le séquençage du génome de familles SCZ a révélé une charge accrue de rares CNVs exonics chez les sujets SCZ ainsi que de l'hétérogénéité génétique. L'utilisation de grandes familles de multiplexes pourrait être statistiquement puissante pour étudier le rôle des CNVs co-ségrégant avec la maladie et éventuellement pathogènes. Afin de mieux comprendre l'hétérogénéité génétique et résoudre l’héritabilité manquante de ces deux troubles mentaux, nous avons utilisé du génotypage et du séquençage de l'exome afin d’examiner le profil génétique de grandes généalogies consanguines multiplexes d’origine Parkistanaise. Chacune de ces familles comportait plus de dix membres affectés par la SCZ ou le TB. Dans cette thèse, nous caractérisons la population d’origine, ce qui comprend le mélange génétique et la consanguinité récente de notre cohorte. Nous avons testé si le niveau de consanguinité était associé au phénotype binaire et à ses dimensions sous-phénotypiques. Nous avons également inclus un grand ensemble de données de populations contrôles externes et appariées afin de calculer et comparer le coefficient de consanguinité. Notre approche, qui comprenait une analyse de liaison, une cartographie de l’auto-zygosité, la détection de cycles homozygotie et une analyse de ségrégation de variantes homozygotes délétères rares, nous a conduit à rejeter l’hypothèse d’un modèle de transmission récessif sur ces familles (malgré leur forte consanguinité). Par la suite, nous avons examiné si des CNVs co-ségrégaient avec le phénotype dans certaines familles. Cette étude comportait plusieurs étapes: 1 - une comparaison systématique entre différents algorithmes de détection de CNVs. 2 - une validation croisée de vrais CNVs ou de faux positifs par des approches in silico ou expérimentales, 3 - le développement d’un logiciel de ségrégation et d'annotation. Cette étude met de l’avant à la fois les avancées méthodologiques et les limites de l’exploration des CNVs. Au final, aucun des CNVs identifiés ne semblent contribuer à la variance génétique de la SCZ et du TB des familles examinées dans cette étude. Les résultats présentés dans cette thèse étayent une hypothèse alternative qui impliquerait des interactions polygéniques entre à la fois des variants rares et des variants communs.Schizophrenia (SCZ) and bipolar disorder (BP) are two major psychiatric disorders. SCZ is a primary psychotic disorder that typically involves symptoms of delusions and hallucinations, by comparison BP is a mood disorder engaging mania and depression but it can also involve psychosis. A 2010 estimation of these disorders highlighted that they respectively contributed to ~7.4% and ~7.0% of the global burden of disease. The high prevalence (~0.4% for SCZ and ~2.4% for BP) and estimated heritability (~80%) suggest a strong genetic influence. Evidence shows that there are some genetic overlaps between the two conditions but also disorder-independent genetic components. Over the past decade, genome-wide association studies (GWAS) identified hundreds of SCZ and BP loci, and other approaches identified various forms of potential genetic risk factors, for instance rare copy number variants (CNVs), rare single nucleotide variants (SNVs) and de novo mutations (DNMs). While our knowledge of the genetic architecture of these conditions grow, a large of portion of the genetic heritability of each disorder still remains unexplained. The combination of a long history of genetic admixture, and the tradition of consanguineous marriages (50% of unions are consanguineous), makes Pakistani families promising for population based medical genetics studies. Consanguinity has previously been associated with an increased risk of numerous traits in epidemiological studies. Family-based designs have been widely applied in the genetic mapping of Mendelian and complex traits. However, few studies have used large multiplex consanguineous families to thoroughly investigate the role of consanguinity in neuropsychiatric disorders such as SCZ and BP. CNVs have been implicated in SCZ and BP since the discovery of 22q11.2 deletions, however, most of them are rare in the population but contribute significantly to the risk. Association studies of CNVs found enrichment of rare deletions and duplications, and a higher rate of de novo CNVs in cases relative to controls. Whole-genome sequencing of multiplex SCZ families reported increased burden of rare, exonic CNV in SCZ probands and genetic heterogeneity. Using large multiplex families could be statistically powerful to investigate the role of segregating, and possibly pathogenic, CNVs. In order to better understand the genetic heterogeneity and look for missing heritability of these two common disorders in Pakistani families, we used SNP genotyping and whole-exome sequencing to examine the genetic profile of ten large multiplex consanguineous pedigrees; each of these families involved more than ten members affected by SCZ or BP. In this thesis, we characterized the population background which includes admixture and recent inbreeding of our cohort. We tested if the inbreeding level was associated with the binary phenotype and its subphenotype dimensions. We also included large external dataset of matched population control individuals to compute and compare the inbreeding coefficient. Our approach, which included linkage analysis, autozygosity mapping, runs of homozygosity (ROH) and rare deleterious homozygous variants segregation analysis, led us to reject the hypothesis of a recessive inheritance model across these families (despite of their high inbreeding). We subsequently looked if any CNV segregated across some of the families. This examination involved multiple steps: 1 - a systematic comparison of a range of CNV detection algorithms currently available through different platforms, 2 - a cross validation of true and false positive CNV calls through the use of in silico or experimental approaches, 3 - the development of our own segregation and annotation software. This effort both emphasized the methodological advances and limitations of CNV studies. In the end, none of the potentially pathogenic CNV identified appeared to account for the genetic variance of SCZ and BP observed in the families examined here. The results presented in this thesis provide support for an alternate hypothesis that would involve a polygenic pattern where both rare variants and common variants would be at play

    Similar works

    Full text

    thumbnail-image