4,815 research outputs found

    A Bayesian Approach to the Evolution of Metabolic Networks on a Phylogeny

    Get PDF
    The availability of genomes of many closely related bacteria with diverse metabolic capabilities offers the possibility of tracing metabolic evolution on a phylogeny relating the genomes to understand the evolutionary processes and constraints that affect the evolution of metabolic networks. Using simple (independent loss/gain of reactions) or complex (incorporating dependencies among reactions) stochastic models of metabolic evolution, it is possible to study how metabolic networks evolve over time. Here, we describe a model that takes the reaction neighborhood into account when modeling metabolic evolution. The model also allows estimation of the strength of the neighborhood effect during the course of evolution. We present Gibbs samplers for sampling networks at the internal node of a phylogeny and for estimating the parameters of evolution over a phylogeny without exploring the whole search space by iteratively sampling from the conditional distributions of the internal networks and parameters. The samplers are used to estimate the parameters of evolution of metabolic networks of bacteria in the genus Pseudomonas and to infer the metabolic networks of the ancestral pseudomonads. The results suggest that pathway maps that are conserved across the Pseudomonas phylogeny have a stronger neighborhood structure than those which have a variable distribution of reactions across the phylogeny, and that some Pseudomonas lineages are going through genome reduction resulting in the loss of a number of reactions from their metabolic networks

    Phenotypic landscape inference reveals multiple evolutionary paths to C4_4 photosynthesis

    Get PDF
    C4_4 photosynthesis has independently evolved from the ancestral C3_3 pathway in at least 60 plant lineages, but, as with other complex traits, how it evolved is unclear. Here we show that the polyphyletic appearance of C4_4 photosynthesis is associated with diverse and flexible evolutionary paths that group into four major trajectories. We conducted a meta-analysis of 18 lineages containing species that use C3_3, C4_4, or intermediate C3_3-C4_4 forms of photosynthesis to parameterise a 16-dimensional phenotypic landscape. We then developed and experimentally verified a novel Bayesian approach based on a hidden Markov model that predicts how the C4_4 phenotype evolved. The alternative evolutionary histories underlying the appearance of C4_4 photosynthesis were determined by ancestral lineage and initial phenotypic alterations unrelated to photosynthesis. We conclude that the order of C4_4 trait acquisition is flexible and driven by non-photosynthetic drivers. This flexibility will have facilitated the convergent evolution of this complex trait

    Genetic structure and evolution of the Leishmania genus in Africa and Eurasia: what does MLSA tell us

    Get PDF
    Leishmaniasis is a complex parasitic disease from a taxonomic, clinical and epidemiological point of view. The role of genetic exchanges has been questioned for over twenty years and their recent experimental demonstration along with the identification of interspecific hybrids in natura has revived this debate. After arguing that genetic exchanges were exceptional and did not contribute to Leishmania evolution, it is currently proposed that interspecific exchanges could be a major driving force for rapid adaptation to new reservoirs and vectors, expansion into new parasitic cycles and adaptation to new life conditions. To assess the existence of gene flows between species during evolution we used MLSA-based (MultiLocus Sequence Analysis) approach to analyze 222 Leishmania strains from Africa and Eurasia to accurately represent the genetic diversity of this genus. We observed a remarkable congruence of the phylogenetic signal and identified seven genetic clusters that include mainly independent lineages which are accumulating divergences without any sign of recent interspecific recombination. From a taxonomic point of view, the strong genetic structuration of the different species does not question the current classification, except for species that cause visceral forms of leishmaniasis (L. donovani, L. infantum and L. archibaldi). Although these taxa cause specific clinical forms of the disease and are maintained through different parasitic cycles, they are not clearly distinct and form a continuum, in line with the concept of species complex already suggested for this group thirty years ago. These results should have practical consequences concerning the molecular identification of parasites and the subsequent therapeutic management of the disease

    A probabilistic model for gene content evolution with duplication, loss, and horizontal transfer

    Full text link
    We introduce a Markov model for the evolution of a gene family along a phylogeny. The model includes parameters for the rates of horizontal gene transfer, gene duplication, and gene loss, in addition to branch lengths in the phylogeny. The likelihood for the changes in the size of a gene family across different organisms can be calculated in O(N+hM^2) time and O(N+M^2) space, where N is the number of organisms, hh is the height of the phylogeny, and M is the sum of family sizes. We apply the model to the evolution of gene content in Preoteobacteria using the gene families in the COG (Clusters of Orthologous Groups) database

    Topological network alignment uncovers biological function and phylogeny

    Full text link
    Sequence comparison and alignment has had an enormous impact on our understanding of evolution, biology, and disease. Comparison and alignment of biological networks will likely have a similar impact. Existing network alignments use information external to the networks, such as sequence, because no good algorithm for purely topological alignment has yet been devised. In this paper, we present a novel algorithm based solely on network topology, that can be used to align any two networks. We apply it to biological networks to produce by far the most complete topological alignments of biological networks to date. We demonstrate that both species phylogeny and detailed biological function of individual proteins can be extracted from our alignments. Topology-based alignments have the potential to provide a completely new, independent source of phylogenetic information. Our alignment of the protein-protein interaction networks of two very different species--yeast and human--indicate that even distant species share a surprising amount of network topology with each other, suggesting broad similarities in internal cellular wiring across all life on Earth.Comment: Algorithm explained in more details. Additional analysis adde

    Genome annotation, comparative genomics and evolution of the model grass genus Brachypodium (Poaceae)

    Get PDF
    INTRODUCCIÓNEn esta Tesis Doctoral se han llevado a cabo estudios evolutivos, biogeográficos, genómicos, transcriptómicos y de expresión génica en los taxones que integran el género Brachypodium (Poaceae) con el objetivo de descifrar los eventos de especiación que han dado lugar a las especies de dicho género. La tesis está constituida por cuatro capítulos con sus respectivos cuatro apéndices. DESARROLLO TEÓRICOCapítulo 1. Reconstrucción de los orígenes y la biogeografía de los genomas de las especies del género modelo de gramíneas Brachypodium, altamente reticulado y rico en especies alopoliploides, mediante métodos de evolución mínima, coalescencia y máxima verosimilitud (Reconstructing the origins and the biogeography of species’ genomes in the highly reticulate allopolyploid-rich model grass genus Brachypodium using minimum evolution, coalescence and maximum likelihood approaches).Se ha reconstruido la filogenia y la historia biogeográfica de las especies reconocidas de Brachypodium mediante el análisis evolutivo del gen nuclear copia simple GIGANTEA (GI), y de otros genes tanto nucleares (ITS, ETS) como plastídicos (ndhF, trnL-F). Para ello se han desarrollado análisis de redes haplotípicas, de mapeo de los alelos poliploides en el árbol de especies diploides por evolución mínima y de construcción del árbol de especies (de genomas y subgenomas), así como la reconstrucción biogeográfica y el cálculo de los tiempos de divergencia de los subgenomas homeólogos por métodos máximo verosímiles y bayesianos, respectivamente, y la estimación por coalescencia de los posibles tiempos en los que se produjeron los eventos de hibridación que dieron lugar a las especies alopoliploides.Nuestros resultados apoyan la naturaleza alopoliploide de las especies poliploides del género, así como un escenario espacio-temporal de diversas divergencias y fusiones de los genomas en las diferentes áreas ancestrales, mostrando un claro predominio de la dispersión de los genomas diploides frente a los alopoliploides. También han sido inferidos los tiempos de divergencia de todas los linajes estudiados, desde el más ancestral, B. stacei (6,8 Ma) hasta los más recientes del “core perennial” (0,7-0,3 Ma).Capítulo 2. Mapeos sinténicos contra genomas de referencia y estudios filogenómicos basados en análisis multigénicos revelan los ancestros de los subgenomas homeologos de especies alopoliploides del género Brachypodium. (Reference-genome syntenic mapping and multigene-based phylogenomics reveal the ancestry of homeologous subgenomes in grass Brachypodium allopolyploids).Se llevaron a cabo mapeos sinténicos de datos transcriptómicos y de genotipado genómico (GBS) contra los genomas de referencia de Brachypodium desarrollando nuestros propios algoritmos y herramientas bioinformáticas. Con esos datos se ha reconstruido la filogenia y se han datado los orígenes de los genomas y subgenomas presentes en especies diploides y alopoliploides de Brachypodium empleando métodos bayesianos y de máxima verosimilitud. Adicionalmente, se ha obtenido y analizado el pan-transcriptoma de las especies estudiadas, identificando genes potencialmente exclusivos de determinados grupos de especies.Los análisis filogenéticos basados en datos transcriptómicos junto con la obtención de tamaños genómicos nos ha permitido elucidar complejos escenarios de hibridación para los subgenomas homeologos de las seis especies alopoliploides de Brachypodium estudiadas, mostrando distintos eventos de hibridación que implican únicamente a genomas ancestrales, a genomas ancestrales y recientes, y únicamente a genomas recientes. Nuestros resultados apoyan el origen ancestral de B. mexicanum, el intermedio de B. boissieri y B. retusum, y la rápida radiación de las especies del “core perennial”.Los capítulos 1 y 2 suponen un completo análisis del género Brachypodium, en especial de las especies alopoliploides, cuyos resultados apoyan y datan los eventos evolutivos que han dado lugar a la compleja y reticulada historia evolutiva que presenta dicho género así como los posibles linajes progenitores de las especies alopoliploides. Capítulo 3. Genómica comparada del plastoma y filogenómica de Brachypodium: improntas de los tiempos de floración, introgresión y recombinación en los ecotipos recientemente evolucionados. (Comparative plastome genomics and phylogenomics of Brachypodium: flowering time signatures, introgression and recombination in recently diverged ecotypes).Se han ensamblado, anotado y analizado los genomas organulares (plastomas) de un amplio número de ecotipos de las especies anuales de Brachypodium, y se ha reconstruido su filogenia, comparándola con la de sus genomas nucleares. Se ha dilucidado la diversificación de los ecotipos y su relación con factores de tiempos de floración y geográficos. El estudio comparativo de los 57 genomas cloroplásticos ensamblados y anotados, 53 B. distachyon, 3 B. hybridum y 1 B. stacei, ha revelado reordenamientos genómicos, como la inserción de 1161 pb y la deleción de una de las copias del gen rps19, característicos de las especies B. stacei y B. hybridum (plastoma tipo stacei), respecto de las líneas de B. distachyon. Se han estimado sus orígenes mediante datación anidada dentro del marco evolutivo de las gramíneas y, para las líneas de B. distachyon, se ha comparado la filogenia plastómica con la nuclear, detectándose una divergencia clara de dos linajes intra-específicos, relacionada con sus tiempos de floración, y una subestructuración más reciente relacionada con su geografía, así como la evidencia de capturas cloroplásticas e introgresión entre clados distantes. Estos datos apoyan que la tendencia a la microespeciación se ve frenada por procesos de introgresión recurrente.Capítulo 4. Características de las redes de co-expresión y los genes diferencialmente expresados explican los patrones de respuesta a sequía en la gramínea modelo Brachypodium distachyon. (Co-expression network features and differentially expressed genes explain drought-response patterns in the model grass Brachypodium distachyon).Se han identificado y analizado genes funcionales implicados en la respuesta ambiental a estrés hídrico mediante el análisis de redes de co-expresión génica y de genes diferencialmente expresados en diversos ecotipos de la planta modelo Brachypodium distachyon.Se han analizado tanto la topología de dichas redes como los genes e isoformas más interconectadas, detectando 38 módulos en la red de co-expresión bajo condiciones de sequía, con 628 genes altamente interconectados (820 transcritos), y 30 módulos en la red de co-expresión en condiciones de riego con 839 genes altamente interconectados (1072 transcritos). Además se han identificado los procesos biológicos en los que están implicados los genes co-expresados, encontrando cinco módulos exclusivos de la red bajo condiciones de sequía de los cuales tres están directamente relacionados con procesos de respuesta a estrés hídrico. Estos resultados han sido correlacionados con datos pan-genómicos observando que la mayoría de los genes co-expresados son genes “core”, conservados en todos la líneas estudiadas, o “soft-core”, conservados en más del 90% de las líneas estudiadas.CONCLUSIONES1-Los análisis evolutivos y biogeográficos de los 20 taxones reconocidos del género Brachypodium empleando cinco genes (tres nucleares y dos plastídicos) indican que aproximadamente la mitad de las especies son diploides y la otra mitad alopoliploides. El análisis de evolución mínima de “injerto” de alelos alopoliploides en las ramas del árbol diploide recobra los linajes homeólogos (subgenomas) de los alopoliploides. Las sucesivas divergencias de los linajes de las diploides anuales (B. stacei, B. distachyon) tuvieron lugar durante el Mioceno tardío-Plioceno en la cuenca Mediterránea, mientras que las de los linajes de las diploides perennes (B. arbuscula, B. genuense, B. sylvaticum, B. glaucovirens, B. pinnatum-2x y B. rupestre-2x) ocurrieron durante el Cuaternario en las regiones Mediterránea y Euroasiática, con colonizaciones esporádicas de otros continentes. Las respectivas divergencias de los linajes homeólogos de los alopoliploides tuvieron lugar en distintos tiempos evolutivos. Nuestro escenario biogeográfico apoya la existencia de dispersiones a larga distancia únicamente en los linajes diploides, mientras que todos los eventos de hibridación y duplicación genómica ocurrieron dentro de las áreas ancestrales progenitoras más recientes, sin posteriores expansiones de área.2- Los análisis filogenómicos mediante datos de RNA-seq y GBS han identificado a B. mexicanum como la especie alopoliploide más antigua mostrando subgenomas de tipo ancestral (A) y materno de tipo stacei (B) (Mioceno medio-tardío). Los alopoliploides de elevado nivel de ploidía, B. boissieri y B. retusum, muestran tres y cuatro subgenomas respectivamente. Ambas especies presentan subgenomas A y B así como el subgenoma intermedio tipo distachyon (C) (Mioceno-Plioceno) (heredado maternalmente en B. boissieri). B. retusum también presenta un subgenoma materno tipo core perennial recientemente evolucionado (D) (Cuaternario). Los alotetraploides del clado core perennial B. rupestre y B. phoenicoides muestran únicamente subgenomas recientemente evolucionados tipo C y D (Cuaternario), siendo los diploides perennes B. pinnatum y B. sylvaticum sus respectivos progenitores maternos. El reciente alopoliploide B. hybridum se formó repetidamente y mediante cruzamientos bidireccionales durante el Cuaternario y es el único alopoliploide del que se conocen ambos progenitores diploides actuales, B. distachyon y B. stacei.3- Los análisis pan-transcriptómicos de 5202 conjuntos de tránscritos del género Brachypodium muestran genes expresados exclusivamente en los grupos de especies perennes (30), anuales (49), poliploides (14), alopoliploides más antiguos (143), especies ancestrales (14) y especies recientemente evolucionadas (52). Los tránscritos exclusivos de los alopoliploides antiguos podrían estar asociados con su genoma ancestral tipo A. Los tránscritos anotados como subunidad ARN polimerasa, encontrados únicamente en todas las especies anuales de Brachypodium, podrían indicar la existencia de diferencias en los niveles de expresión de las ARN polimerasas entre las especies anuales y perennes, o la pérdida de copias ancestrales en las especies perennes más recientemente evolucionadas.4- Los análisis pan-genómicos de los plastomas de 53 ecotipos de B. distachyon, 3 de B. hybridum y 1 de B. stacei han detectado una inserción (1161 pb) y una deleción en una de las copias del gen rps19 que diferencian a los plastomas de B. stacei y B. hybridum con respecto a los de B. distachyon, sin que se haya observado variación en el contenido génico entre los plastomas de B. distachyon.5- El árbol filogenómico de los plastomas de B. distachyon muestra la divergencia de dos linajes principales, correspondientes a los clados Extremely Delayed Flowering (EDF+) y Spanish (S+) – Turkish (T+), sugiriendo que el tiempo de floración es un factor decisivo en la divergencia intra-específica de B. distachyon. La comparación topológica entre las filogenias nucleares y plastídicas de esta especie revela nueve eventos de captura cloroplástica y dos de introgresión y micro-recombinación entre esos clados, apoyando la existencia de flujo génico entre linajes previamente aislados. Los intercambios de plastomas entre los tres grupos, EDF+, T+, S+, probablemente hayan sido el resultado de retro-cruzamientos aleatorios seguidos de estabilización por presión selectiva.6- Los análisis mediante redes ponderadas de co-expresión génica llevados a cabo en 33 ecotipos de B. distachyon bajo condiciones de sequía y riego identificaron cinco módulos exclusivos de la red de sequía, incluyendo 465 isoformas y 11 genes altamente interconectados (hubs). El análisis seleccionó genes candidatos y factores de transcripción (bHLH, ABF1, MADS box) potencialmente implicados en la regulación de la respuesta a sequía, tales como la síntesis de prolina y las respuestas a carencias de agua o fosfato, así como a estímulos por temperatura. Los análisis de expresión diferencial de genes en los ecotipos han detectado 4941 tránscritos, de los cuales dos terceras partes están sobre-expresados en las plantas en condiciones de sequía con respecto a las sometidas a condiciones de riego. Los análisis pan-transcriptómicos muestran que la mayoría de los genes expresados en ambas condiciones son genes del core, presentes en todos los ecotipos estudiados, mientras que una fracción de los genes hub corresponden a genes soft-core y shell, encontrados únicamente en algunos ecotipos. <br /

    Optimized ancestral state reconstruction using Sankoff parsimony

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>Parsimony methods are widely used in molecular evolution to estimate the most plausible phylogeny for a set of characters. Sankoff parsimony determines the minimum number of changes required in a given phylogeny when a cost is associated to transitions between character states. Although optimizations exist to reduce the computations in the number of taxa, the original algorithm takes time <it>O</it>(<it>n</it><sup>2</sup>) in the number of states, making it impractical for large values of <it>n</it>.</p> <p>Results</p> <p>In this study we introduce an optimization of Sankoff parsimony for the reconstruction of ancestral states when ultrametric or additive cost matrices are used. We analyzed its performance for randomly generated matrices, Jukes-Cantor and Kimura's two-parameter models of DNA evolution, and in the reconstruction of elongation factor-1<it>α </it>and ancestral metabolic states of a group of eukaryotes, showing that in all cases the execution time is significantly less than with the original implementation.</p> <p>Conclusion</p> <p>The algorithms here presented provide a fast computation of Sankoff parsimony for a given phylogeny. Problems where the number of states is large, such as reconstruction of ancestral metabolism, are particularly adequate for this optimization. Since we are reducing the computations required to calculate the parsimony cost of a single tree, our method can be combined with optimizations in the number of taxa that aim at finding the most parsimonious tree.</p
    corecore