In this thesis we developed two approaches to study positive selection and genetic
adaptation in the human genome. Both approaches are based on applications of
network theory.
In the first approach, we studied how the signals of selection are distributed among
the genes of a metabolic pathway. We use a network representation of the Asparagine
N-Glycosylation pathway, and determine if given positions are more likely to be
involved in selection events. We determined a different distribution of signals
between the upstream part of this pathway, which has a linear structure and is
involved in a conserved process, and the downstream part of the pathway, which has a
complex network structure and is involved in adaptation to the environment.
In the second approach, we applied a network representation of the set of genotypes
observed in a population (Genotype Network) to next-generation sequencing data.
The main result is a genome-wide picture of how the populations of the 1000
Genomes dataset have explored the genotype space. We found that the genotype
networks of coding regions tend to be more connected and more expanded in the
space than non coding regions, and that simulated sweeps have similar patterns
compared to simulated neutral regions.En esta tesis hemos desarrollado dos métodos para estudiar los patrones de selección positiva y adaptación genética en el genoma humano. Ambos métodos se basan en aplicaciones de teoría de redes.
En la primera aplicación hemos investigado cómo las señales de selección están distribuidas a lo largo de una ruta metabólica. Hemos utilizado una representación de la ruta de N-Glicosilación, para estudiar si determinadas posiciones tienen más probabilidades de estar implicadas en eventos de selección positiva. Hemos comparado la distribución de las señales de selección entre la primera parte de la ruta metabólica, que tiene una estructura muy lineal y está involucrada en un proceso conservado, y la segunda parte de la ruta, que tiene una estructura de redes compleja y está involucrada en adaptación al ambiente.
En la segunda aplicación hemos aplicado el concepto de redes de genotipos (Genotype Networks) a datos de secuencia de nueva generación. El resultado es un análisis completo de cómo las poblaciones de 1000 Genomas han explorado el espacio de genotipo. Las redes de genotipos de regiones codificantes suelen estar más conectadas y más expandidas que las regiones no-codificantes. Además, por medio de simulaciones hemos observado los patrones esperados para eventos de selección positiva