6 research outputs found

    Integer programming for selecting set of informative markers in paternity inference

    Get PDF
    BACKGROUND: Parentage information is fundamental to various life sciences. Recent advances in sequencing technologies have made it possible to accurately infer parentage even in non-model species. The optimization of sets of genome-wide markers is valuable for cost-effective applications but requires extremely large amounts of computation, which presses for the development of new efficient algorithms. RESULTS: Here, for a closed half-sib population, we generalized the process of marker loci selection as a binary integer programming problem. The proposed systematic formulation considered marker localization and the family structure of the potential parental population, resulting in an accurate assignment with a small set of markers. We also proposed an efficient heuristic approach, which effectively improved the number of markers, localization, and tolerance to missing data of the set. Applying this method to the actual genotypes of apple (Malus × domestica) germplasm, we identified a set of 34 SNP markers that distinguished 300 potential parents crossed to a particular cultivar with a greater than 99% accuracy. CONCLUSIONS: We present a novel approach for selecting informative markers based on binary integer programming. Since the data generated by high-throughput sequencing technology far exceeds the requirement for parentage assignment, a combination of the systematic marker selection with targeted SNP genotyping, such as KASP, allows flexibly enlarging the analysis up to a scale that has been unrealistic in various species. The method developed in this study can be directly applied to unsolved large-scale problems in breeding, reproduction, and ecological research, and is expected to lead to novel knowledge in various biological fields. The implementation is available at https://github.com/SoNishiyama/IP-SIMPAT

    Genome-wide scan of single nucleotide polymorphisms for parentage analyses in South African indigenous beef breeds

    Get PDF
    Thesis (PhD (Animal Science))--University of Pretoria, 2022.Genotyping panels using single nucleotide polymorphism (SNP) markers have superseded the use of microsatellites for parentage testing and other applications. High-density SNP arrays enable accurate parentage assignment but they are not always practical for routine application. The major constraints include high cost coupled with the time spent in analyzing the results. The International Society for Animal Genetics (ISAG) recommends a low-density SNP panel consisting of 200 genomic markers for parentage testing globally. However, SNPs specific to Sanga cattle breeds were not included in constructing the panel, and its utility for use has not been verified in Sanga cattle. This thesis, therefore, firstly tested the usefulness of these ISAG markers for parentage testing in Sanga cattle with verified parentage. The results demonstrated a poor performance of the ISAG panel in both Bonsmara (BON) and Drakensberger (DRB) for parentage verification, with false negatives ranging from 23.4% (BON) to 33% (DRB). This implied that relying on the ISAG panel alone may cause incorrect exclusions and, at times, be unable to determine parentages when closely related candidate parents are considered. The second objective of the thesis was to quantify the accuracy of parentage recording but also the detection of individuals exhibiting hemizygous deletions using 91 185 autosomal SNPs. On average, 8.5% to 10.1% of parentage errors were detected in the recorded BON and DRB pedigree, respectively indicating recording errors on farms. The discovery of the parent-progeny pairs based on SNP genotypes was possible for 69 relationships that had not actually been recorded. Eleven suggestive regions of hemizygosity were detected on 10 chromosomes (3, 6, 7, 9, 10, 11, 17, 24, 25 and 28) in animals mostly used for breeding which included 6 (BON) and 9 (DRB) bulls and as well 10 (BON) and 8 (DRB) cows. Finally, low-density genotype SNP panels for parentage testing consisting of 200 markers were developed. SNPs were chosen to be informative both within and across breeds. The methods to select informative SNPs considered high minor allele frequency (MAF), good clustering quality, and high call rates. SNPs were pruned to reduce the linkage disequilibrium among markers with a minimum distance of one Mb apart. All the panels selected were tested per breed. On average, the genotype panel with SNPs selected across the breeds had a lower MAF of 0.40 compared to 0.48 (DRB) and 0.49 (BON) selected within breeds. SNP markers selected within breed were more accurate at parentage testing with no false negative whereas 4.2% false negatives were observed in the BON using the multi-breed panel. The methods and results presented in this thesis can be used in the construction of parentage SNP panels to provide parentage verification which will contribute to quality control in breeding systems and thus accelerate genetic improvement.University of Pretoria (UP)Agricultural Research Council - ARCNational Research Council - NRFAnimal and Wildlife SciencesPhD (Animal Science)Unrestricte

    Genetic connectivity of the slinger Chrysoblephus puniceus among Marine Protected Areas and unprotected areas along the east coast of South Africa

    Get PDF
    Marine Protected Areas (MPAs) are advocated worldwide for the conservation of biodiversity and fisheries management, as well as for adaptation and resilience in the face of climate change. Their effectiveness has been noted through increases in abundances, biomass, sizes and diversity of species, as well as the recovery of overexploited fisheries. For MPAs to realise their full potential, these benefits need to expand beyond their boundaries through larval dispersal and/or adult spillover. Connectivity between MPAs is critical for planning and placement of MPAs, as this promotes the persistence of metapopulations, their recovery from disturbance, as well as productivity in marine ecosystems. The effectiveness of MPAs in conserving biodiversity along the east coast of South Africa has been established; however, limited evidence is available on whether they offer benefits beyond their boundaries, enhancing biodiversity and fisheries in adjacent areas. The slinger Chrysoblephus puniceus, an endemic southern African sparid, is a major component of the commercial linefishery in KwaZulu-Natal (KZN), South Africa and southern Mozambique, and is also caught in the recreational ski-boat fishery in these regions. The spawning of slinger occurs in shoals on offshore reefs from southern Mozambique to the north of KZN, and larvae are likely transported southwards, assisted by the southward-flowing Agulhas Current and promoted by a relatively long larval duration. Slinger are relatively resident, but occasional northward migrations have been observed. These life history characteristics suggested that slinger would be a suitable biological model to test connectivity along the east coast, and particularly connectivity between MPAs. The aim of this study was therefore to investigate connectivity of slinger between MPAs and the surrounding areas along the east coast of South Africa, using restriction-site-associated DNA (RAD) sequencing. This formed part of the larger CAPTOR project investigating east coast MPA connectivity across a range of taxa and habitat types. A temporal comparison of genetic diversity in slinger spanning two sampling events (2012 and 2018) revealed no substantial changes in genetic diversity, as well as a lack of genetic structure along the KZN coast. Similarly, no substantial changes in effective population size (Ne) were found between 2012 and 2018 for microsatellites and Single Nucleotide Polymorphisms (SNPs). However, subtle, albeit non-significant, differences were observed both spatially and over time in the microsatellite data, indicating some instability along the KZN coast. A lack of genetic structure based on RAD sequencing was observed between east coast MPAs and the surrounding areas. This implies high connectivity along the coast - not only are east coast MPAs connected, the surrounding areas are also connected, and there is replenishment between all areas via larval dispersal and/or adult spillover. Analyses of multidirectional gene flow between MPAs, together with known spatial spawning patterns and prior particle dispersal modelling, identified the Richards Bay area as a key source of recruits. However, parentage analysis – a direct method to estimate connectivity – failed to match any parent-offspring pairs in this study; successful parentage assignments are highly dependent on intensive sampling of potential parents and are seldom feasible in marine systems, as most populations have large effective population sizes. Estimates of intergenerational effective population size for slinger in this study are considered large - >2 000 and infinite based on adults and juveniles, respectively. Population genetics revealed close genetic similarities between slinger adult and juvenile slinger sites, emphasizing genetic connectivity and the lack of structure between sites observed before. This was the first study on South African sparids to use RAD sequencing to assess genetic connectivity between MPAs along the east coast of South Africa. Overall, results provide evidence that MPAs along the east coast of South Africa are connected, and can readily replenish or be replenished by other sites along the east coast of South Africa, whether they are within MPAs or not. So too are the areas surrounding MPAs interconnected, and slinger forms a homogenous single population on the east coast of South Africa. This notwithstanding, it is important that east coast MPAs, particularly those that host spawning shoals of slinger, are well managed in order that they continue to provide recruits to sustain the population and support sustainable fisheries.Thesis (PhD) -- Faculty of Science, Ichthyology and Fisheries Science, 202

    Desarrollo de poblaciones multiparentales como fuente de nuevos recursos genéticos para el mejoramiento de girasol

    Get PDF
    Tesis para la obtención del grado de Doctor en Ciencias Agrarias, otorgado por la Universidad Nacional de Rosario, en diciembre de 2022El área de cultivo de girasol en Argentina, se extiende entre los 24 y 38 grados de latitud sur, abarcando una amplia gama de ambientes. La plasticidad del cultivo en su adaptación a diversas condiciones agroecológicas lo convierte en el segundo cultivo oleaginoso en importancia después de la soja. Desde fines de la década del 90´ el cultivo de girasol fue desplazado a zonas con menor potencialidad productiva a causa de adversidades bióticas y abióticas que limitan los rendimientos obtenidos. Las principales enfermedades del girasol son la roya negra causada por Puccinia helianthi, downy mildew causado por Plasmopara halstedii, marchitez anticipada causada por Verticillium dahliae, el cancro del tallo y del capítulo causado por Diaporthe helianthi y la podredumbre húmeda del capítulo causada por Sclerotinia sclerotiorum. La diversidad de ambientes y de estreses a los que se ve expuesto el cultivo de girasol han impulsado los estudios de las bases genéticas de la resistencia a estreses bióticos y abióticos para poder lograr genotipos de mayor adaptabilidad, estabilidad y rendimiento. La identificación de los factores genéticos responsables de la expresión de características de interés agronómico se basa en la disponibilidad de colecciones de germoplasma de base genética amplia. El desarrollo de la genómica en los últimos años favoreció la caracterización de la diversidad genética presente en estas colecciones y la implementación de diferentes estrategias de mejoramiento basado en poblaciones no estructuradas y más recientemente en poblaciones estructuradas a partir del cruzamiento de múltiples líneas parentales. Las poblaciones multiparentales de tipo MAGIC por sus siglas en inglés “Multiparent Advanced Generation Inter-Cross populations” han surgido como una alternativa en el estudio de QTLs ofreciendo características intermedias entre las poblaciones biparentales y los paneles de asociación en términos de diversidad, potencia y resolución. El objetivo general de la presente Tesis fue diseñar, construir y caracterizar poblaciones multiparentales de girasol para complementar la plataforma actual de recursos genéticos del programa de mejoramiento de INTA para el estudio de regiones genómicas de interés agronómico. Se desarrollaron dos poblaciones MAGIC a partir de 8 líneas endocriadas mantenedoras de la fertilidad. Las líneas seleccionadas para la formación de las poblaciones presentan características diferenciales para distintos caracteres de interés para el mejoramiento del cultivo. Se priorizó la elección de materiales caracterizados en estudios previos del grupo girasol de INTA frente a las enfermedades marchitez anticipada por V. dahliae y podredumbre húmeda del capítulo por S. sclerotiorum. También, fueron considerados otros caracteres de interés como la resistencia a Downy mildew, el contenido de aceite, la composición de ácidos grasos, la senescencia, el ciclo y la aptitud combinatoria. En la campaña 2020/21 se completó el segundo ciclo de autofecundaciones avanzando ambas poblaciones al estado de F3 y obteniéndose 1161 familias para la población MAGIC1 y 1497 familias para la población MAGIC2. Fueron genotipadas las líneas parentales de ambas poblaciones y los híbridos de 2, 4 y 8 vías obtenidos en las etapas de desarrollo a través de la técnica de doble restricción enzimática para reducir la complejidad del genoma seguida por secuenciación de alto rendimiento. En esta instancia de desarrollo de las poblaciones, los datos genotípicos contribuyeron a testear la calidad de las líneas parentales altamente homocigotas, evaluar la diversidad genética entre ellas y la reconstrucción de haplotipos indicando la efectividad de los cruzamientos y el potencial de las poblaciones para el mapeo fino de QTLs. Las familias F2 de ambas poblaciones MAGIC fueron caracterizadas fenotípicamente en INTA Pergamino en la campaña 2020/21 para caracteres de interés agronómico como floración, altura del ápice de la lámina en relación al nivel de inserción del pecíolo en el estrato superior de la planta, inclinación del capítulo y altura de planta. La población MAGIC2 fue caracterizada por su respuesta frente a la marchitez anticipada en el infectario natural de INTA Balcarce en la campaña 2020/21. Los resultados obtenidos confirmaron la variabilidad fenotípica de las poblaciones, permitieron identificar grupos de familias con respuesta contrastante a la marchitez anticipada y demostrar el potencial de ambas poblaciones para su utilización en futuros estudios de mapeo fino de QTLs. Asimismo, en este experimento fue evaluada la implementación de imágenes multiespectrales obtenidas por drones para el fenotipado de la marchitez anticipada en girasol. Los resultados obtenidos revelaron el potencial que tiene la implementación de índices de vegetación para el fenotipado de la marchitez anticipada en girasol y la utilización de modelos de aprendizaje que permiten, en base a la información aportada por los índices espectrales, poder clasificar genotipos de girasol como tolerantes o resistentes a la enfermedad. La construcción y caracterización de las poblaciones MAGIC presentadas en esta Tesis, constituyen recursos genéticos únicos hasta el momento para el mejoramiento del cultivo a nivel nacional e internacional.The sunflower area in Argentina ranges from 24 to 38 °S and covers a wide range of environments. The diversity of stresses affecting sunflower has led to the study of the genetic basis of resistance to biotic and abiotic stresses in order to obtain genotypes with greater adaptability, stability and yield. Multiparent Advanced Generation Inter-Cross Populations (MAGIC) have emerged as an alternative in the study of QTLs offering intermediate characteristics in diversity, power and resolution between biparental populations and association panels. The objective of this work was to design, construct and characterize multiparental populations of sunflower to complement the genetic resources of the INTA breeding program for the study of genomic regions of agronomic interest. Two MAGIC populations were developed from 8 maintainer inbred lines. In the 2020/21 season, the second cycle of selffertilization was completed, advancing both populations to F3 status and a total of 1161 families were obtained for MAGIC1 population and 1497 families for MAGIC2 population. The parental lines of both populations and the 2-, 4- and 8-way hybrids were genotyped using Genotyping By Sequencing (GBS) technique. The genotypic data helped to test the quality of the highly homozygous parental lines, evaluate genetic diversity, and perform parentage analysis. The results demonstrated the effectiveness of the crosses and the potential of the populations for fine mapping of QTLs. The F2 families of both MAGIC populations were phenotyped in the 2020/21 season at INTA Pergamino for agronomic traits such as flowering, petiole angle, head angle and plant height. The MAGIC2 population response to Verticillium wilt (VW) was characterized in infested fields of INTA Balcarce in the 2020/21 season. The results obtained confirmed the phenotypic variability of the populations, allowed the identification of groups of families with differential response to VW and demonstrated the potential of both populations for use in future fine mapping studies of QTLs. In addition, the use of multispectral images acquired from drones for VW phenotyping in sunflower demonstrated the potential of this technique for high-throughput phenotyping of fungal diseases in sunflower. The construction and characterization of the MAGIC populations presented in this Thesis represent unique genetic resources for sunflower breeding at national and international levels and will have a positive impact on the development of sunflower breeding as they can be use in research, development and transfer to industry.EEA PergaminoFil: Domínguez, Matías. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria Pergamino. Sección Girasol; ArgentinaFil: Domínguez, Matías. Consejo Nacional de Investigaciones Científicas y Técnicas; Argentin

    Desarrollo de poblaciones multiparentales como fuente de nuevos recursos genéticos para el mejoramientoi del girasol

    Get PDF
    El área de cultivo de girasol en Argentina, se extiende entre los 24 y 38 grados de latitud sur, abarcando una amplia gama de ambientes. La plasticidad del cultivo en su adaptación a diversas condiciones agroecológicas lo convierte en el segundo cultivo oleaginoso en importancia después de la soja. Desde fines de la década del 90´ el cultivo de girasol fue desplazado a zonas con menor potencialidad productiva a causa de adversidades bióticas y abióticas que limitan los rendimientos obtenidos. Las principales enfermedades del girasol son la roya negra causada por Puccinia helianthi, downy mildew causado por Plasmopara halstedii, marchitez anticipada causada por Verticillium dahliae, el cancro del tallo y del capítulo causado por Diaporthe helianthi y la podredumbre húmeda del capítulo causada por Sclerotinia sclerotiorum. La diversidad de ambientes y de estreses a los que se ve expuesto el cultivo de girasol han impulsado los estudios de las bases genéticas de la resistencia a estreses bióticos y abióticos para poder lograr genotipos de mayor adaptabilidad, estabilidad y rendimiento. La identificación de los factores genéticos responsables de la expresión de características de interés agronómico se basa en la disponibilidad de colecciones de germoplasma de base genética amplia. El desarrollo de la genómica en los últimos años favoreció la caracterización de la diversidad genética presente en estas colecciones y la implementación de diferentes estrategias de mejoramiento basado en poblaciones no estructuradas y más recientemente en poblaciones estructuradas a partir del cruzamiento de múltiples líneas parentales. Las poblaciones multiparentales de tipo MAGIC por sus siglas en inglés “Multiparent Advanced Generation Inter-Cross populations” han surgido como una alternativa en el estudio de QTLs ofreciendo características intermedias entre las poblaciones biparentales y los paneles de asociación en términos de diversidad, potencia y resolución. El objetivo general de la presente Tesis fue diseñar, construir y caracterizar poblaciones multiparentales de girasol para complementar la plataforma actual de recursos genéticos del programa de mejoramiento de INTA para el estudio de regiones genómicas de interés agronómico. Se desarrollaron dos poblaciones MAGIC a partir de 8 líneas endocriadas mantenedoras de la fertilidad. Las líneas seleccionadas para la formación de las poblaciones presentan características diferenciales para distintos caracteres de interés para el mejoramiento del cultivo. Se priorizó la elección de materiales caracterizados en estudios previos del grupo girasol de INTA frente a las enfermedades marchitez anticipada por V. dahliae y podredumbre húmeda del capítulo por S. sclerotiorum. También, fueron considerados otros caracteres de interés como la resistencia a Downy mildew, el contenido de aceite, la composición de ácidos grasos, la senescencia, el ciclo y la aptitud combinatoria. En la campaña 2020/21 se completó el segundo ciclo de autofecundaciones avanzando ambas poblaciones al estado de F3 y obteniéndose 1161 familias para la población MAGIC1 y 1497 familias para la población MAGIC2. Fueron genotipadas las líneas parentales de ambas poblaciones y los híbridos de 2, 4 y 8 vías obtenidos en las etapas de desarrollo a través de la técnica de doble restricción enzimática para reducir la complejidad del genoma seguida por secuenciación de alto rendimiento. En esta instancia de desarrollo de las poblaciones, los datos genotípicos contribuyeron a testear la calidad de las líneas parentales altamente homocigotas, evaluar la diversidad genética entre ellas y la reconstrucción de haplotipos indicando la efectividad de los cruzamientos y el potencial de las poblaciones para el mapeo fino de QTLs. Las familias F2 de ambas poblaciones MAGIC fueron caracterizadas fenotípicamente en INTA Pergamino en la campaña 2020/21 para caracteres de interés agronómico como floración, altura del ápice de la lámina en relación al nivel de inserción del pecíolo en el estrato superior de la planta, inclinación del capítulo y altura de planta. La población MAGIC2 fue caracterizada por su respuesta frente a la marchitez anticipada en el infectario natural de INTA Balcarce en la campaña 2020/21. Los resultados obtenidos confirmaron la variabilidad fenotípica de las poblaciones, permitieron identificar grupos de familias con respuesta contrastante a la marchitez anticipada y demostrar el potencial de ambas poblaciones para su utilización en futuros estudios de mapeo fino de QTLs. Asimismo, en este experimento fue evaluada la implementación de imágenes multiespectrales obtenidas por drones para el fenotipado de la marchitez anticipada en girasol. Los resultados obtenidos revelaron el potencial que tiene la implementación de índices de vegetación para el fenotipado de la marchitez anticipada en girasol y la utilización de modelos de aprendizaje que permiten, en base a la información aportada por los índices espectrales, poder clasificar genotipos de girasol como tolerantes o resistentes a la enfermedad. La construcción y caracterización de las poblaciones MAGIC presentadas en esta Tesis, constituyen recursos genéticos únicos hasta el momento para el mejoramiento del cultivo a nivel nacional e internacional.Fil: Apellido, Nombre. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; ArgentinaFil: Domínguez, Matías. Universidad Nacional de Rosario. Facultad de Ciencias Agrarias; Argentin
    corecore