28 research outputs found

    Utilisation des données de séquence pour la cartographie fine et l'évaluation génomique des caractères d'intérêt des caprins laitiers français

    Get PDF
    La filière caprine française a intégré l’ère de la génomique avec le récent développement et la valorisation d’une puce à ADN dans les années 2010-2020 pour la recherche de QTL et l’évaluation génétique. La démocratisation des données de séquençage tout génome pour les animaux de rente ouvre de nouvelles perspectives. Le projet VarGoats, a pour but de mettre à disposition d’un consortium international, un jeu de données de plus de 1000 séquences pour l’espèce Capra hircus. L’étude de la qualité d’imputation vers la séquence dans la filière caprine est un préalable nécessaire à l’utilisation de cette dernière dans les analyses d’association pour la détection de QTL ainsi que dans les évaluations génomiques. L’objectif principal de ces travaux est d’étudier l’intégration potentielle des données de séquence dans les programmes d’amélioration génétique de la filière laitière caprine française. La mise en place d’un contrôle de la qualité des données de séquence a représenté un travail majeur dans ma thèse. Il s’est appuyé sur une recherche bibliographique ainsi que sur la comparaison des génotypes 50k disponibles avec les séquences filtrées. Finalement, sur les 97 889 899 SNP et 12 304 043 indels initiaux, nous avons retenu 23 338 436 variants dont 40 491 appartenaient au set de SNP de la puce Illumina GoatSNP50 BeadChip. Une étude préalable de l’imputation depuis la puce 50k vers la séquence a ensuite été menée dans le but d’obtenir un nombre suffisant de séquences imputées de bonne qualité. Plusieurs méthodes d’imputation (imputation populationnelle ou familiale) et plusieurs logiciels ont été testés en utilisant les données de séquence disponibles (829 séquences des différences races caprines internationales). En intra-race, les taux de concordances génotypiques et alléliques ont été estimées à 0,74 et 0,86 en Saanen et 0,76 et 0,87 en Alpine respectivement. Les corrélations étaient alors de 0,26 et 0,24 en Alpine et Saanen respectivement. Les séquences imputées des mâles ont permis la confirmation de QTL précédemment observés sur les génotypes 50k ainsi que la détection de nouvelles régions d’intérêt. L’exhaustivité des données de séquence représentait une opportunité sans précédent d’approfondir une région QTL du chromosome 19 en Saanen qui est associée à la fois à des caractères de production mais aussi à des caractères de morphologie et santé de la mamelle ainsi qu’à des caractères de production de semence. Cette analyse n’a pas abouti à l’identification de mutations candidates. Néanmoins, nous avons pu proposer un moyen simple d’identifier des profils génomiques et phénotypiques particuliers en race Saanen à partir d’un génotype 50k. Cette méthode pourra s’avérer utile en terme de prédiction précoce tant en France qu’à l’international. Enfin, en réunissant l’ensemble des travaux effectués précédemment, nous avons étudié l’impact de l’intégration de données de séquence imputées sur le chromosome 19 sur la précision des évaluations en race Saanen françaises. Plusieurs modèles d’évaluations ont été mis en oeuvre et comparés : single-step GBLUP (ssGBLUP), single-step GBLUP pondéré (WssGBLUP) en utilisant différents panels de variants imputés. Les meilleurs résultats ont été obtenus en utilisant un ssGBLUP incluant les génotypages 50k et les variants imputés de la région du QTL du chromosome 19 (entre 24,72 et 28,38 Mb) avec des gains de +6,2% de précision en moyenne sur les caractères évalués. La mise à jour de la puce caprine à laquelle j’ai participé représente une perspective d’amélioration de la précision des évaluations. Elle permet d’améliorer significativement la qualité des évaluations génomiques (entre 3,1 et 6,4% en fonction du scenario considéré) tout en limitant les temps de calculs liés à l’imputation notamment. Ces travaux confortent l’intérêt de l’utilisation de données de séquence dans les programmes de sélection caprins français et ouvrent la perspective de leur intégration dans la routine des évaluations

    VarGoats project : a dataset of 1159 whole-genome sequences to dissect Capra hircus global diversity

    Get PDF
    Since their domestication 10,500 years ago, goat populations with distinctive genetic backgrounds have adapted to a broad variety of environments and breeding conditions. The VarGoats project is an international 1000-genome resequencing program designed to understand the consequences of domestication and breeding on the genetic diversity of domestic goats and to elucidate how speciation and hybridization have modeled the genomes of a set of species representative of the genus Capra. A dataset comprising 652 sequenced goats and 507 public goat sequences, including 35 animals representing eight wild species, has been collected worldwide. We identified 74,274,427 single nucleotide polymorphisms (SNPs) and 13,607,850 insertion-deletions (InDels) by aligning these sequences to the latest version of the goat reference genome (ARS1). A Neighbor-joining tree based on Reynolds genetic distances showed that goats from Africa, Asia and Europe tend to group into independent clusters. Because goat breeds from Oceania and Caribbean (Creole) all derive from imported animals, they are distributed along the tree according to their ancestral geographic origin. We report on an unprecedented international effort to characterize the genome-wide diversity of domestic goats. This large range of sequenced individuals represents a unique opportunity to ascertain how the demographic and selection processes associated with post-domestication history have shaped the diversity of this species. Data generated for the project will also be extremely useful to identify deleterious mutations and polymorphisms with causal effects on complex traits, and thus will contribute to new knowledge that could be used in genomic prediction and genome-wide association studies

    Inborn errors of OAS-RNase L in SARS-CoV-2-related multisystem inflammatory syndrome in children

    Get PDF
    Funding Information: The Laboratory of Human Genetics of Infectious Diseases is supported by the Howard Hughes Medical Institute, the Rockefeller University, the St. Giles Foundation, the National Institutes of Health (NIH) (R01AI088364 and R21AI160576), the National Center for Advancing Translational Sciences (NCATS), NIH Clinical and Translational Science Award (CTSA) program (UL1TR001866), the Yale Center for Mendelian Genomics and the GSP Coordinating Center funded by the National Human Genome Research Institute (NHGRI) (UM1HG006504 and U24HG008956), the Yale High-Performance Computing Center (S10OD018521), the Fisher Center for Alzheimer's Research Foundation, the Meyer Foundation, the JBP Foundation, the French National Research Agency (ANR) under the "Investments for the Future" program (ANR-10-IAHU-01), the Integrative Biology of Emerging Infectious Diseases Laboratory of Excellence (ANR-10-LABX-62-IBEID), the French Foundation for Medical Research (FRM) (EQU201903007798), the ANR GenMISC (ANR-21-COVR-039), the ANRS-COV05, ANR GENVIR (ANR-20-CE93-003) and ANR AABIFNCOV (ANR-20-CO11-0001) projects, the ANR-RHU program (ANR-21-RHUS-08), the European Union's Horizon 2020 research and innovation program under grant agreement 824110 (EASI-genomics), the HORIZON-HLTH-2021-DISEASE-04 program under grant agreement 01057100 (UNDINE), the ANR-RHU Program ANR-21-RHUS-08 (COVIFERON), the Square Foundation, Grandir - Fonds de solidarité pour l'enfance, the Fondation du Souffle, the SCOR Corporate Foundation for Science, the French Ministry of Higher Education, Research, and Innovation (MESRI-COVID-19), Institut National de la Santé et de la Recherche Médicale (INSERM), and Paris Cité University. We acknowledge support from the National Institute of Allergy and Infectious Diseases (NIAID) of the NIH under award R01AI104887 to R.H.S. and S.R.W. The Laboratory of Human Evolutionary Genetics (Institut Pasteur) is supported by the Institut Pasteur, the Collège de France, the French Government's Investissement d'Avenir program, Laboratoires d'Excellence "Integrative Biology of Emerging Infectious Diseases" (ANR-10-LABX-62-IBEID) and "Milieu Intérieur" (ANR-10-LABX-69-01), the Fondation de France (no. 00106080), the FRM (Equipe FRM DEQ20180339214 team), and the ANR COVID-19-POPCELL (ANR-21-CO14-0003-01). A. Puj. is supported by ACCI20-759 CIBERER, EasiGenomics H2020 Marató TV3 COVID 2021-31-33, the HORIZON-HLTH-2021-ID: 101057100 (UNDINE), the Horizon 2020 program under grant no. 824110 (EasiGenomics grant no. COVID-19/PID12342), and the CERCA Program/Generalitat de Catalunya. The Canarian Health System sequencing hub was funded by the Instituto de Salud Carlos III (COV20-01333 and COV20-01334), the Spanish Ministry of Science and Innovation (RTC-2017-6471-1; AEI/FEDER, UE), Fundación MAPFRE Guanarteme (OA21/131), and Cabildo Insular de Tenerife (CGIEU0000219140 and "Apuestas científicas del ITER para colaborar en la lucha contra la COVID-19"). The CoV-Contact Cohort was funded by the French Ministry of Health and the European Commission (RECOVER project). Our studies are also funded by the Ministry of Health of the Czech Republic Conceptual Development of Research Organization (FNBr, 65269705) and ANID COVID0999 funding in Chile. G. Novelli and A. Novelli are supported by Regione Lazio (Research Group Projects 2020) No. A0375-2020-36663, GecoBiomark. A.M.P., M.L.D., and J.P.-T. are supported by the Inmungen-CoV2 project of CSIC. This work was supported in part by the Intramural Research Program of the NIAID, NIH. The research work of A.M.P, M.L.D., and J.P.-T. was funded by the European Commission-NextGenerationEU (Regulation EU 2020/2094), through CSIC's Global Health Platform (PTI Salud Global). I.M. is a senior clinical investigator at FWO Vlaanderen supported by a VIB GC PID grant, by FWO grants G0B5120N (DADA2) and G0E8420N, and by the Jeffrey Modell Foundation. I.M. holds an ERC-StG MORE2ADA2 grant and is also supported by ERN-RITA. A.Y. is supported by fellowships from the European Academy of Dermatology and Venereology and the Swiss National Science Foundation and by an Early Career Award from the Thrasher Research Fund. Y.-H.C. is supported by an A*STAR International Fellowship (AIF). M.O. was supported by the David Rockefeller Graduate Program, the New York Hideyo Noguchi Memorial Society (HNMS), the Funai Foundation for Information Technology (FFIT), the Honjo International Scholarship Foundation (HISF), and the National Cancer Institute (NCI) F99 Award (F99CA274708). A.A.A. was supported by Ministerio de Ciencia Tecnología e Innovación MINCIENCIAS, Colombia (111584467551/CT 415-2020). D.L. is supported by a fellowship from the FRM for medical residents and fellows. E.H. received funding from the Bank of Montreal Chair of Pediatric Immunology, Foundation of CHU Sainte-Justine, CIHR grants PCC-466901 and MM1-181123, and a Canadian Pediatric Society IMPACT study. Q.P.-H. received funding from the European Union's Horizon 2020 research and innovation program (ATAC, 101003650), the Swedish Research Council, and the Knut and Alice Wallenberg Foundation. Work in the Laboratory of Virology and Infectious Disease was supported by NIH grants P01AI138398-S1, 2U19AI111825, R01AI091707-10S1, and R01AI161444; a George Mason University Fast Grant; the G. Harold and Leila Y. Mathers Charitable Foundation; the Meyer Foundation; and the Bawd Foundation. R.P.L. is on the board of directors of both Roche and the Roche subsidiary Genentech. J.L.P. was supported by a Francois Wallace Monahan Postdoctoral Fellowship at the Rockefeller University and by a European Molecular Biology Organization Long-Term Fellowship (ALTF 380-2018). Publisher Copyright: © 2023 American Association for the Advancement of Science. All rights reserved.Multisystem inflammatory syndrome in children (MIS-C) is a rare and severe condition that follows benign COVID-19. We report autosomal recessive deficiencies of OAS1, OAS2, or RNASEL in five unrelated children with MIS-C. The cytosolic double-stranded RNA (dsRNA)-sensing OAS1 and OAS2 generate 2'-5'-linked oligoadenylates (2-5A) that activate the single-stranded RNA-degrading ribonuclease L (RNase L). Monocytic cell lines and primary myeloid cells with OAS1, OAS2, or RNase L deficiencies produce excessive amounts of inflammatory cytokines upon dsRNA or severe acute respiratory syndrome coronavirus 2 (SARS-CoV-2) stimulation. Exogenous 2-5A suppresses cytokine production in OAS1-deficient but not RNase L-deficient cells. Cytokine production in RNase L-deficient cells is impaired by MDA5 or RIG-I deficiency and abolished by mitochondrial antiviral-signaling protein (MAVS) deficiency. Recessive OAS-RNase L deficiencies in these patients unleash the production of SARS-CoV-2-triggered, MAVS-mediated inflammatory cytokines by mononuclear phagocytes, thereby underlying MIS-C.publishersversionpublishe

    Rare predicted loss-of-function variants of type I IFN immunity genes are associated with life-threatening COVID-19

    Get PDF
    Background We previously reported that impaired type I IFN activity, due to inborn errors of TLR3- and TLR7-dependent type I interferon (IFN) immunity or to autoantibodies against type I IFN, account for 15–20% of cases of life-threatening COVID-19 in unvaccinated patients. Therefore, the determinants of life-threatening COVID-19 remain to be identified in ~ 80% of cases. Methods We report here a genome-wide rare variant burden association analysis in 3269 unvaccinated patients with life-threatening COVID-19, and 1373 unvaccinated SARS-CoV-2-infected individuals without pneumonia. Among the 928 patients tested for autoantibodies against type I IFN, a quarter (234) were positive and were excluded. Results No gene reached genome-wide significance. Under a recessive model, the most significant gene with at-risk variants was TLR7, with an OR of 27.68 (95%CI 1.5–528.7, P = 1.1 × 10−4) for biochemically loss-of-function (bLOF) variants. We replicated the enrichment in rare predicted LOF (pLOF) variants at 13 influenza susceptibility loci involved in TLR3-dependent type I IFN immunity (OR = 3.70[95%CI 1.3–8.2], P = 2.1 × 10−4). This enrichment was further strengthened by (1) adding the recently reported TYK2 and TLR7 COVID-19 loci, particularly under a recessive model (OR = 19.65[95%CI 2.1–2635.4], P = 3.4 × 10−3), and (2) considering as pLOF branchpoint variants with potentially strong impacts on splicing among the 15 loci (OR = 4.40[9%CI 2.3–8.4], P = 7.7 × 10−8). Finally, the patients with pLOF/bLOF variants at these 15 loci were significantly younger (mean age [SD] = 43.3 [20.3] years) than the other patients (56.0 [17.3] years; P = 1.68 × 10−5). Conclusions Rare variants of TLR3- and TLR7-dependent type I IFN immunity genes can underlie life-threatening COVID-19, particularly with recessive inheritance, in patients under 60 years old

    X-linked recessive TLR7 deficiency in ~1% of men under 60 years old with life-threatening COVID-19

    Get PDF
    Autosomal inborn errors of type I IFN immunity and autoantibodies against these cytokines underlie at least 10% of critical COVID-19 pneumonia cases. We report very rare, biochemically deleterious X-linked TLR7 variants in 16 unrelated male individuals aged 7 to 71 years (mean, 36.7 years) from a cohort of 1202 male patients aged 0.5 to 99 years (mean, 52.9 years) with unexplained critical COVID-19 pneumonia. None of the 331 asymptomatically or mildly infected male individuals aged 1.3 to 102 years (mean, 38.7 years) tested carry such TLR7 variants (P = 3.5 × 10−5). The phenotypes of five hemizygous relatives of index cases infected with SARS-CoV-2 include asymptomatic or mild infection (n = 2) or moderate (n = 1), severe (n = 1), or critical (n = 1) pneumonia. Two patients from a cohort of 262 male patients with severe COVID-19 pneumonia (mean, 51.0 years) are hemizygous for a deleterious TLR7 variant. The cumulative allele frequency for deleterious TLR7 variants in the male general population is <6.5 × 10−4. We show that blood B cell lines and myeloid cell subsets from the patients do not respond to TLR7 stimulation, a phenotype rescued by wild-type TLR7. The patients’ blood plasmacytoid dendritic cells (pDCs) produce low levels of type I IFNs in response to SARS-CoV-2. Overall, X-linked recessive TLR7 deficiency is a highly penetrant genetic etiology of critical COVID-19 pneumonia, in about 1.8% of male patients below the age of 60 years. Human TLR7 and pDCs are essential for protective type I IFN immunity against SARS-CoV-2 in the respiratory tract

    Using sequence data for fine QTL mapping and genomic evaluation of traits of interest in French dairy goats

    No full text
    La filière caprine française a intégré l’ère de la génomique avec le récent développement et la valorisation d’une puce à ADN dans les années 2010-2020 pour la recherche de QTL et l’évaluation génétique. La démocratisation des données de séquençage tout génome pour les animaux de rente ouvre de nouvelles perspectives. Le projet VarGoats, a pour but de mettre à disposition d’un consortium international, un jeu de données de plus de 1000 séquences pour l’espèce Capra hircus. L’étude de la qualité d’imputation vers la séquence dans la filière caprine est un préalable nécessaire à l’utilisation de cette dernière dans les analyses d’association pour la détection de QTL ainsi que dans les évaluations génomiques. L’objectif principal de ces travaux est d’étudier l’intégration potentielle des données de séquence dans les programmes d’amélioration génétique de la filière laitière caprine française. La mise en place d’un contrôle de la qualité des données de séquence a représenté un travail majeur dans ma thèse. Il s’est appuyé sur une recherche bibliographique ainsi que sur la comparaison des génotypes 50k disponibles avec les séquences filtrées. Finalement, sur les 97 889 899 SNP et 12 304 043 indels initiaux, nous avons retenu 23 338 436 variants dont 40 491 appartenaient au set de SNP de la puce Illumina GoatSNP50 BeadChip. Une étude préalable de l’imputation depuis la puce 50k vers la séquence a ensuite été menée dans le but d’obtenir un nombre suffisant de séquences imputées de bonne qualité. Plusieurs méthodes d’imputation (imputation populationnelle ou familiale) et plusieurs logiciels ont été testés en utilisant les données de séquence disponibles (829 séquences des différences races caprines internationales). En intra-race, les taux de concordances génotypiques et alléliques ont été estimées à 0,74 et 0,86 en Saanen et 0,76 et 0,87 en Alpine respectivement. Les corrélations étaient alors de 0,26 et 0,24 en Alpine et Saanen respectivement. Les séquences imputées des mâles ont permis la confirmation de QTL précédemment observés sur les génotypes 50k ainsi que la détection de nouvelles régions d’intérêt. L’exhaustivité des données de séquence représentait une opportunité sans précédent d’approfondir une région QTL du chromosome 19 en Saanen qui est associée à la fois à des caractères de production mais aussi à des caractères de morphologie et santé de la mamelle ainsi qu’à des caractères de production de semence. Cette analyse n’a pas abouti à l’identification de mutations candidates. Néanmoins, nous avons pu proposer un moyen simple d’identifier des profils génomiques et phénotypiques particuliers en race Saanen à partir d’un génotype 50k. Cette méthode pourra s’avérer utile en terme de prédiction précoce tant en France qu’à l’international. Enfin, en réunissant l’ensemble des travaux effectués précédemment, nous avons étudié l’impact de l’intégration de données de séquence imputées sur le chromosome 19 sur la précision des évaluations en race Saanen françaises. Plusieurs modèles d’évaluations ont été mis en oeuvre et comparés : single-step GBLUP (ssGBLUP), single-step GBLUP pondéré (WssGBLUP) en utilisant différents panels de variants imputés. Les meilleurs résultats ont été obtenus en utilisant un ssGBLUP incluant les génotypages 50k et les variants imputés de la région du QTL du chromosome 19 (entre 24,72 et 28,38 Mb) avec des gains de +6,2% de précision en moyenne sur les caractères évalués. La mise à jour de la puce caprine à laquelle j’ai participé représente une perspective d’amélioration de la précision des évaluations. Elle permet d’améliorer significativement la qualité des évaluations génomiques (entre 3,1 et 6,4% en fonction du scenario considéré) tout en limitant les temps de calculs liés à l’imputation notamment. Ces travaux confortent l’intérêt de l’utilisation de données de séquence dans les programmes de sélection caprins français et ouvrent la perspective de leur intégration dans la routine des évaluations.French dairy goats recently integrated genomics with the development of a DNA chip in the 2010s and the first QTL detections and genomic evaluations. The availability of sequence data for farm animals opens up new opportunities. The VarGoats project is an international 1,000 genomes resequencing program designed to provide sequence information of the Capra hircus species. The study of imputation quality to sequence level is a necessary first step before using imputed sequences in association analysis and genomic evaluations. The main objective of this work was to study the possible integration of sequence data in the French dairy goats breeding programs. The set up of a quality check represented a sizable part of this thesis. It was based on bibliographic research and the comparison between available 50k genotypes and sequence data. Out of the initial 97,889,899 SNPs and 12,304,043 indels, we eventually retained 23,338,436 variants including 40,491 SNPs of the Illumina GoatSNP50 BeadChip. A preliminary study of imputation from 50k genotypes to sequence was then performed with the aim of getting a sufficient number of sequenced animals of good quality. Several softwares and methods were considered (family or population imputation) using the 829 sequenced animals available. Within-breed imputation led to genotype and allele concordance of 0.74 and 0.86 in Saanen and 0.76 and 0.87 in Alpine respectively. Correlations were then of 0.26 and 0.24 in Alpine and Saanen respectively. Imputed sequence of males confirmed signals previously identified using 50k genotypes and allowed the detection of new regions of interest. The density of sequence data represented an unprecedented opportunity to deepen our understanding of QTL region of chromosome 19 in the Saanen breed. This region is associated to production, type and udder health traits as well as semen production traits. Our analysis did not point out any candidate mutation. However, we offer a simple way to identify genomic and phenotypic profiles in the Saanen breed using 50k genotypes. This method could be of use for early prediction in France but also worldwide. Finally, using all previous results, we studied the impact of the integrating imputed sequence data of chromosome 19 on the accuracy of evaluations in French Saanen. Several evaluation models were compared : single-step GBLUP (ssGBLUP) and weighted single-step GBLUP (WssGBLUP) using different panels of imputed variants. Best results were obtained using ssGBLUP with 50k genotypes and all variants on the QTL region of chromosome 19 (between 24.72 and 28.38Mb): +6.2% accuracy on average for all evaluated traits. The 50k chip update to which I participated represents a opportunity to improve genomic evaluations. Indeed, it significantly improved accuracy of predictions (between 3.1 and 6.4% on average depending on the scenario) while limiting computation time associated to imputation. This work confirms the benefits of using sequence data in the French dairy goats breeding programs and opens up the perspective of integrating them in the routine genomic evaluations

    Ewes’ functional longevity: analysis and modelling in French suckling sheep breeds

    No full text
    International audienceIn the light of an increasing demand for robustness, functional longevity appears to be an interesting criterion to study in addition to the current main selection criteria for French suckling sheep (prolificacy and mothering qualities). This study aims at characterizing genetic and non-genetic effects on functional longevity for French suckling ewes. Functional longevity is approached through length of productive life, using linear models as well as survival analysis methods. Analysis are undertaken on two representative French breeds (one specialized meat breed and a hardy meat breed), using data from the national performance recording system. Linear models are applied on the 62,410 Ile-de-France and 93,679 Blanches du Massif Central ewes born between 1990 and 2004 (uncensored careers). Survival analysis focuses on ewes born after 1990 from a known ram. Main significantly influencing non-genetic factors (P<0.05) were flock (mean size, acceleration, induction, renewal rates) and first lambing (age, number of lambs) characteristics. Heritability estimations were low with estimated values around 0.05 regardless of the breed or of the statistical approach. Although, selection could be intended on this trait in regard to its variability in the studied populations and the possibility of defining an early predictor
    corecore