Applications of network theory to human population genetics : from pathways to genotype networks

Abstract

In this thesis we developed two approaches to study positive selection and genetic adaptation in the human genome. Both approaches are based on applications of network theory. In the first approach, we studied how the signals of selection are distributed among the genes of a metabolic pathway. We use a network representation of the Asparagine N-Glycosylation pathway, and determine if given positions are more likely to be involved in selection events. We determined a different distribution of signals between the upstream part of this pathway, which has a linear structure and is involved in a conserved process, and the downstream part of the pathway, which has a complex network structure and is involved in adaptation to the environment. In the second approach, we applied a network representation of the set of genotypes observed in a population (Genotype Network) to next-generation sequencing data. The main result is a genome-wide picture of how the populations of the 1000 Genomes dataset have explored the genotype space. We found that the genotype networks of coding regions tend to be more connected and more expanded in the space than non coding regions, and that simulated sweeps have similar patterns compared to simulated neutral regions.En esta tesis hemos desarrollado dos métodos para estudiar los patrones de selección positiva y adaptación genética en el genoma humano. Ambos métodos se basan en aplicaciones de teoría de redes. En la primera aplicación hemos investigado cómo las señales de selección están distribuidas a lo largo de una ruta metabólica. Hemos utilizado una representación de la ruta de N-Glicosilación, para estudiar si determinadas posiciones tienen más probabilidades de estar implicadas en eventos de selección positiva. Hemos comparado la distribución de las señales de selección entre la primera parte de la ruta metabólica, que tiene una estructura muy lineal y está involucrada en un proceso conservado, y la segunda parte de la ruta, que tiene una estructura de redes compleja y está involucrada en adaptación al ambiente. En la segunda aplicación hemos aplicado el concepto de redes de genotipos (Genotype Networks) a datos de secuencia de nueva generación. El resultado es un análisis completo de cómo las poblaciones de 1000 Genomas han explorado el espacio de genotipo. Las redes de genotipos de regiones codificantes suelen estar más conectadas y más expandidas que las regiones no-codificantes. Además, por medio de simulaciones hemos observado los patrones esperados para eventos de selección positiva

    Similar works