6 research outputs found

    Evaluation of the potential use of multiple populations in genomic evaluation

    Full text link
    [EN] Marker-assisted selection has been introduced into the breeding programs of livestock populations during the last few years. Particularly, the cattle industry was the first to incorporate the Genomic Selection (GS) into its breeding programs. GS has been proved to be a very useful tool for increasing the efficiency of the breeding programs of dairy (inglés)[ES] En los últimos años, la selección asistida por marcadores se ha introducido en los programas de mejora genética animal. En particular, el sector de vacuno de leche ha sido el primero en introducir la selección genómica (GS) en sus esquemas de mejora. En ellos, se ha probado que la selección genómica es una herramienta de gran interés. Por el contrMouresan, EF. (2013). Evaluation of the potential use of multiple populations in genomic evaluation. http://hdl.handle.net/10251/44466Archivo delegad

    Evaluation of the efficiency of the procedures of genomic selection in the autochthonous spanish beef cattle populations

    Get PDF
    La Selección Genómica (SG) ha constituido un indudable éxito en la mejora genética de vacuno de leche, y su aplicación en otras especies, como el porcino, está siendo introducida gradualmente. Sin embargo, existen varios factores que han impedido su desarrollo en vacuno de carne. Entre otros, el gran número de poblaciones de censo limitado, la reducida implantación de la inseminación artificial y la insuficiente cantidad de fenotipos impiden la generación de poblaciones de referencia de alta calidad y la obtención de predicciones de alta precisión. Las poblaciones autóctonas de vacuno de carne en España tienen un censo muy limitado, pero juegan un papel vital en el mantenimiento de la actividad económica rural y en la producción de productos de alta calidad. Hoy en día, sus esquemas de mejora están basados en las evaluaciones genéticas mediante BLUP, y la utilización de la información molecular se restringe a escasos genes mayores y a la aplicación de test de paternidad. Por lo tanto, el principal objetivo de esta tesis doctoral es investigar la potencial aplicación de la Selección Genómica en estas poblaciones, tanto a partir de una aproximación especifica en cada población, como mediante una aproximación conjunta de varias poblaciones. El material biológico que se ha utilizado en el desarrollo del trabajo ha consistido en 171 tríos (padre/madre/descendiente) procedentes de siete poblaciones locales de vacuno de carne (Asturiana de los Valles -AV-, n=25; Avileña-Negra Ibérica -ANI-, n=24; Bruna dels Pirineus -BP-, n=25; Morucha -Mo-, n=25; Pirenaica -Pi-, n=24; Retinta -Re-, n=24; Rubia Gallega -RG-, n=24) que se genotiparon para 777,962 marcadores SNP mediante el BovineHD BeadChip. Además, se utilizó la información genealógica y fenotípica procedente de dos de las poblaciones (Pirenaica -Pi- y Rubia Gallega -RG-). El primer trabajo analizó la eficiencia de la aplicación de la SG en dos poblaciones (Pi y RG), bajo la aproximación “single-step”. Se analizaron varias estrategias de genotipado, así como otros factores, como la densidad de marcadores, el tamaño efectivo de la población, la tasa de mutación y la heredabilidad del carácter. Los resultados mostraron que la SG siempre proporciono un incremento de la precisión sobre la evaluación genética mediante BLUP. Pese a todo, el mayor beneficio se obtuvo cuando los candidatos a la selección estaban genotipados. Además, se probó que la estrategia de genotipado que muestreaba a los individuos con menor error de predicción maximizaba la precisión, pero que, a pesar de ello, estrategias sub-óptimas también ofrecieron resultados satisfactorios. Por otra parte, se observó un incremento de la precisión a mayor densidad de genotipado, pero que alcanzó un “plateau” en torno a 50,000 marcadores. Del mismo modo, valores menores de tamaño efectivo y de tasa de mutación proporcionaron un incremento en la precisión. Finalmente, los resultados obtenidos a partir de la población RG fueron superiores a los obtenidos en la población Pi, debido a la mayor implantación de la inseminación artificial. El segundo estudio abordo la potencial aplicación de la SG bajo un modelo multi-población. Para ello, se definieron poblaciones de evaluación compuestas a partir de individuos de una y de varias poblaciones y se analizaron bajo varios escenarios de arquitectura genética de los caracteres. Las evaluaciones en población única proporcionaron la mayor precisión dentro cada población. Las precisiones de la predicción entre poblaciones fueron muy bajas, aunque siempre positivas poniendo en evidencia la conexión genética entre estas poblaciones. Las poblaciones compuestas proporcionaron una precisión menor si se comparan con la evaluación en población única, pero mostraron una pequeña ventaja sobre las poblaciones de referencia de pura raza de tamaño reducido sobre la precisión de las generaciones posteriores. Las precisiones obtenidas al combinar todas las poblaciones resultaron inferiores a las obtenidas a partir de la simple selección individual Por otra parte, la arquitectura genética de los caracteres no mostro ningún efecto relevante, salvo el escenario de simulación que utilizó variantes raras para la generación de la variabilidad genética de los caracteres. En él, se observaron una menor precisión y una mayor pérdida de la misma a lo largo de las generaciones.El éxito de la SG a partir de una población de referencia compuesta está relacionado con la persistencia del desequilibrio de ligamiento (DL) entre poblaciones. El tercer estudio pretendió analizar la arquitectura genética de la persistencia de DL entre las siete poblaciones analizadas. Se utilizaron dos métodos (VarLD y CorLD) que mostraron resultados diferentes. El método VarLD permitió detectar diferencias entre los patrones de DL entre poblaciones, pero no pudo identificar las regiones de mayor persistencia de DL. Por el contrario, el método CorLD sí que fue capaz de detectarlas. Los genes localizados en estas regiones de mayor persistencia entre poblaciones participan en rutas metabólicas que incluyen procesos de adhesión celular, sinapsis, organización y desarrollo del sistema nervioso, asociadas, en general, con la familia génica de las protocaderinas (Protocadherin). Pese a todo, la incorporación de la información acerca de la persistencia de fase de DL en los modelos de evaluación genómica no proporcionó ningún incremento de precisión tanto dentro como entre poblaciones.Finalmente, se analizó la diversidad haplotípica a lo largo del genoma en las siete poblaciones y se mostró una notable heterogeneidad en la misma. En general, la diversidad fue mayor en la cercanía de los telómeros que en la parte central de los cromosomas. Es destacable que las regiones de alta diversidad haplotipica fueron coincidentes entre poblaciones, sugiriendo que las causas de esta diversidad son estructurales, como pueden ser las tasas de mutación y recombinación locales.<br /

    Mapping recombination rate on the autosomal chromosomes based on the persistency of linkage disequilibrium phase among autochthonous beef cattle populations in Spain

    Get PDF
    Mouresan, Elena Flavia. Universidad de Zaragoza. Departamento de Anatomía, Embriología y Genética Animal. Zaragoza, España.González Rodríguez, Aldemar. Universidad de Zaragoza. Departamento de Anatomía, Embriología y Genética Animal. Zaragoza, España.Cañas Alvarez, Jhon J. Universitat Autònoma de Barcelona. Departament de Ciència Animal i dels Aliments. Barcelona, España.Munilla Leguizamón, Sebastián. Universidad de Zaragoza. Departamento de Anatomía, Embriología y Genética Animal. Zaragoza, España.Altarriba, Juan. Universidad de Zaragoza. Departamento de Anatomía, Embriología y Genética Animal. Zaragoza, España.Díaz, Clara. Instituto Nacional de Investigación y Tecnología Agraria y Alimentaria (INIA). Departamento de Mejora Genética Animal. Madrid, España.Baro, Jesus A. Instituto Agroalimentario de Aragón (IA2). Zaragoza, España.Molina, Antonio. Universidad de Valladolid. Departamento de Ciencias Agroforestales. Valladolid, España.12In organisms with sexual reproduction, genetic diversity, and genome evolution are governed by meiotic recombination caused by crossing-over, which is known to vary within the genome. In this study, we propose a simple method to estimate the recombination rate that makes use of the persistency of linkage disequilibrium (LD) phase among closely related populations. The biological material comprised 171 triplets (sire/ dam/offspring) from seven populations of autochthonous beef cattle in Spain (Asturiana de los Valles, Avileña-Negra Ibérica, Bruna dels Pirineus, Morucha, Pirenaica, Retinta, and Rubia Gallega), which were genotyped for 777,962 SNPs with the BovineHD BeadChip. After standard quality filtering, we reconstructed the haplotype phases in the parental individuals and calculated the LD by the correlation -r- between each pair of markers that had a genetic distance smaller than 1 Mb. Subsequently, these correlations were used to calculate the persistency of LD phase between each pair of populations along the autosomal genome. Therefore, the distribution of the recombination rate along the genome can be inferred since the effect of the number of generations of divergence should be equivalent throughout the genome. In our study, the recombination rate was highest in the largest chromosomes and at the distal portion of the chromosomes. In addition, the persistency of LD phase was highly heterogeneous throughout the genome, with a ratio of 25.4 times between the estimates of the recombination rates from the genomic regions that had the highest (BTA18-7.1 Mb) and the lowest (BTA12- 42.4 Mb) estimates. Finally, an over representation enrichment analysis (ORA) showed differences in the enriched gene ontology (GO) terms between the genes located in the genomic regions with estimates of the recombination rate over (or below) the 95th (or 5th) percentile throughout the autosomal genome

    Genomic prediction including SNP-specific variance predictors

    No full text
    The increasing amount of available biological information on the markers can be used to inform the models applied for genomic selection to improve predictions. The objective of this study was to propose a general model for genomic selection using a link function approach within the hierarchical generalized linear model framework (hglm) that can include external information on the markers. These models can be fitted using the well-established hglm package in R. We also present an R package (CodataGS) to fit these models, which is significantly faster than the hglm package. Simulated data were used to validate the proposed model. We tested categorical, continuous and combination models where the external information on the markers was related to 1) the location of the QTL on the genome with varying degree of uncertainty, 2) the relationship of the markers with the QTL calculated as the LD between them, and 3) a combination of both. The proposed models showed improved accuracies from 3.8% up to 23.2% compared to the SNP-BLUP method in a simulated population derived from a base population with 100 individuals. Moreover, the proposed categorical model was tested on a dairy cattle dataset for two traits (Milk Yield and Fat Percentage). These results also showed improved accuracy compared to SNP-BLUP, especially for the Fat% trait. The performance of the proposed models depended on the genetic architecture of the trait, as traits that deviate from the infinitesimal model benefited more from the external information. Also, the gain in accuracy depended on the degree of uncertainty of the external information provided to the model. The usefulness of these type of models is expected to increase with time as more accurate information on the markers becomes available

    Genomic Prediction Including SNP-Specific Variance Predictors

    No full text
    The increasing amount of available biological information on the markers can be used to inform the models applied for genomic selection to improve predictions. The objective of this study was to propose a general model for genomic selection using a link function approach within the hierarchical generalized linear model framework (hglm) that can include external information on the markers. These models can be fitted using the well-established hglm package in R. We also present an R package (CodataGS) to fit these models, which is significantly faster than the hglm package. Simulated data was used to validate the proposed model. We tested categorical, continuous and combination models where the external information on the markers was related to 1) the location of the QTLs on the genome with varying degree of uncertainty, 2) the relationship of the markers with the QTLs calculated as the LD between them, and 3) a combination of both. The proposed models showed improved accuracies from 3.8% up to 23.2% compared to the SNP-BLUP method in a simulated population derived from a base population with 100 individuals. Moreover, the proposed categorical model was tested on a dairy cattle dataset for two traits (Milk Yield and Fat Percentage). These results also showed improved accuracy compared to SNP-BLUP, especially for the Fat% trait. The performance of the proposed models depended on the genetic architecture of the trait, as traits that deviate from the infinitesimal model benefited more from the external information. Also, the gain in accuracy depended on the degree of uncertainty of the external information provided to the model. The usefulness of these type of models is expected to increase with time as more accurate information on the markers becomes available

    Big Multiple Sclerosis Data network: an international registry research network

    No full text
    Background The Big Multiple Sclerosis Data (BMSD) network (https://bigmsdata.org) was initiated in 2014 and includes the national multiple sclerosis (MS) registries of the Czech Republic, Denmark, France, Italy, and Sweden as well as the international MSBase registry. BMSD has addressed the ethical, legal, technical, and governance-related challenges for data sharing and so far, published three scientific papers on pooled datasets as proof of concept for its collaborative design.Data collection Although BMSD registries operate independently on different platforms, similarities in variables, definitions and data structure allow joint analysis of data. Certain coordinated modifications in how the registries collect adverse event data have been implemented after BMSD consensus decisions, showing the ability to develop together.Data management Scientific projects can be proposed by external sponsors via the coordinating centre and each registry decides independently on participation, respecting its governance structure. Research datasets are established in a project-to-project fashion and a project-specific data model is developed, based on a unifying core data model. To overcome challenges in data sharing, BMSD has developed procedures for federated data analysis.Future perspectives Presently, BMSD is seeking a qualification opinion from the European Medicines Agency (EMA) to conduct post-authorization safety studies (PASS) and aims to pursue a qualification opinion also for post-authorization effectiveness studies (PAES). BMSD aspires to promote the advancement of real-world evidence research in the MS field
    corecore