Search CORE

4,815 research outputs found

A Bayesian Approach to the Evolution of Metabolic Networks on a Phylogeny

Author: A Gelfand
A Mithani
A Mithani
A Rico
A Zeigarnik
Aviv Regev
Aziz Mithani
B Kelley
B Kelley
C Forst
C Forst
C Pál
C Wiuf
Gail M. Preston
HR Ueda
I Holmes
J Berg
J Felsenstein
J Felsenstein
J Koskinen
J Peregrin-Alvarez
Jotun Hein
M Behr
M Heymans
M Kanehisa
M Stumpf
M Yeung
N Metropolis
O Ratmann
S Boccaletti
S Dorogovtsev
S Geman
S Sarkar
T Dandekar
W Fitch
W Gilks
W Hastings
Publication venue: Public Library of Science
Publication date: 01/01/2010
Field of study

The availability of genomes of many closely related bacteria with diverse metabolic capabilities offers the possibility of tracing metabolic evolution on a phylogeny relating the genomes to understand the evolutionary processes and constraints that affect the evolution of metabolic networks. Using simple (independent loss/gain of reactions) or complex (incorporating dependencies among reactions) stochastic models of metabolic evolution, it is possible to study how metabolic networks evolve over time. Here, we describe a model that takes the reaction neighborhood into account when modeling metabolic evolution. The model also allows estimation of the strength of the neighborhood effect during the course of evolution. We present Gibbs samplers for sampling networks at the internal node of a phylogeny and for estimating the parameters of evolution over a phylogeny without exploring the whole search space by iteratively sampling from the conditional distributions of the internal networks and parameters. The samplers are used to estimate the parameters of evolution of metabolic networks of bacteria in the genus Pseudomonas and to infer the metabolic networks of the ancestral pseudomonads. The results suggest that pathway maps that are conserved across the Pseudomonas phylogeny have a stronger neighborhood structure than those which have a variable distribution of reactions across the phylogeny, and that some Pseudomonas lineages are going through genome reduction resulting in the loss of a number of reactions from their metabolic networks

Crossref

Directory of Open Access Journals

PubMed Central

Oxford University Research Archive

Recommended from our members

Comparative Dating Of Attine Ant And Lepiotaceous Cultivar Phylogenies Reveals Coevolutionary Synchrony And Discord

Author: Abbot Patrick
Mikheyev Alexander S.
Mueller Ulrich G.
Publication venue: 'University of Chicago Press'
Publication date: 01/06/2010
Field of study

The mutualistic symbiosis between fungus-gardening ants and their cultivars has made fundamental contributions to our understanding of the coevolution of complex species interactions. Reciprocal specialization and vertical symbiont cotransmission are thought to promote a pattern of largely synchronous coevolutionary diversification in attines. Here we test this hypothesis by inferring the first time-calibrated multigene phylogeny of the lepiotaceous attine cultivars and comparing it with the recently published fossil-anchored phylogeny of the attine ants. While this comparison reveals some possible cases of synchronous origins of ant and fungal clades, there were a number of surprising asynchronies. For example, leaf-cutter cultivars appear to be significantly younger than the corresponding ant genera. Similarly, a clade of fungi interacting with primitive fungus-gardening ants-thought to be ancestral to the more derived leaf-cutter symbionts-appears instead to be a more recent acquisition from free-living stock. These macroevolutionary patterns are consistent with recent population-level studies suggesting occasional acquisition of novel cultivar types from environmental sources and horizontal transmission of cultivars between different ant species. Horizontal transmission events, even if rare, appear to form loose ecological connections between diffusely coevolving ant and fungus lineages that permit punctuated changes in the topology of the mutualistic ant-fungus interaction network.Integrative Biolog

Texas ScholarWorks

Phenotypic landscape inference reveals multiple evolutionary paths to C $_4$ photosynthesis

Author: Abramoff
Adams
Akyildiz
Aubry
Beebe
Brown
Brown
Bruhl
Bustin
Casati
Cheng
Christin
Christin
Christin
Christin
Christin
Devi
Devi
Edwards
Furbank
Gavrilets
Goldstein
Gowik
Griffiths
Hatch
Hattersley
Hattersley
Heckman
Hibberd
Hill
Holaday
Holaday
Holaday
Hylton
Johnson
Kajala
Keeley
Kennedy
Khoshravesh
Kidwell
Koteyeva
Kozmik
Ku
Ku
Ku
Ku
Langdale
Livak
Lobkovsky
McKown
McKown
Mooers
Moore
Muhaidat
Osborne
P’yankov
Rabiner
Rajendrudu
Rathnam
Rathnam
Rawsthorne
Rawsthorne
Revuz
Rosche
Roweis
Sage
Sage
Sage
Santos
Sayre
Slack
Smith
Steiner
Ueno
Ueno
Vicentini
Vogan
Voznesenskaya
Voznesenskaya
Voznesenskaya
Wasserman
Weinreich
Whibley
Williams
Wilson
Wiludda
Wittkopp
Wright
Zhu
Publication venue: 'eLife Sciences Publications, Ltd'
Publication date: 01/01/2013
Field of study

_4

photosynthesis has independently evolved from the ancestral C

_3

pathway in at least 60 plant lineages, but, as with other complex traits, how it evolved is unclear. Here we show that the polyphyletic appearance of C

_4

photosynthesis is associated with diverse and flexible evolutionary paths that group into four major trajectories. We conducted a meta-analysis of 18 lineages containing species that use C

_3

, C

_4

, or intermediate C

_3

-C

_4

forms of photosynthesis to parameterise a 16-dimensional phenotypic landscape. We then developed and experimentally verified a novel Bayesian approach based on a hidden Markov model that predicts how the C

_4

phenotype evolved. The alternative evolutionary histories underlying the appearance of C

_4

photosynthesis were determined by ancestral lineage and initial phenotypic alterations unrelated to photosynthesis. We conclude that the order of C

_4

trait acquisition is flexible and driven by non-photosynthetic drivers. This flexibility will have facilitated the convergent evolution of this complex trait

arXiv.org e-Print Archive

Crossref

University of Birmingham Research Portal

PubMed Central

Spiral - Imperial College Digital Repository

Genetic structure and evolution of the Leishmania genus in Africa and Eurasia: what does MLSA tell us

Author: Berry Vincent
Brisse Sylvain
Chevenet François
Diancourt Laure
El Baidouri Fouad
Marty Pierre
Pratlong Francine
Ravel Christophe
Publication venue: 'Public Library of Science (PLoS)'
Publication date: 01/01/2013
Field of study

Leishmaniasis is a complex parasitic disease from a taxonomic, clinical and epidemiological point of view. The role of genetic exchanges has been questioned for over twenty years and their recent experimental demonstration along with the identification of interspecific hybrids in natura has revived this debate. After arguing that genetic exchanges were exceptional and did not contribute to Leishmania evolution, it is currently proposed that interspecific exchanges could be a major driving force for rapid adaptation to new reservoirs and vectors, expansion into new parasitic cycles and adaptation to new life conditions. To assess the existence of gene flows between species during evolution we used MLSA-based (MultiLocus Sequence Analysis) approach to analyze 222 Leishmania strains from Africa and Eurasia to accurately represent the genetic diversity of this genus. We observed a remarkable congruence of the phylogenetic signal and identified seven genetic clusters that include mainly independent lineages which are accumulating divergences without any sign of recent interspecific recombination. From a taxonomic point of view, the strong genetic structuration of the different species does not question the current classification, except for species that cause visceral forms of leishmaniasis (L. donovani, L. infantum and L. archibaldi). Although these taxa cause specific clinical forms of the disease and are maintained through different parasitic cycles, they are not clearly distinct and form a continuum, in line with the concept of species complex already suggested for this group thirty years ago. These results should have practical consequences concerning the molecular identification of parasites and the subsequent therapeutic management of the disease

University of Lincoln Institutional Repository

HAL-UNICE

Directory of Open Access Journals

HAL Descartes

Hal-Diderot

FigShare

Public Library of Science (PLOS)

PubMed Central

HAL-IRD

Red de Bibliotecas Virtuales de Ciencias Sociales de América Latina y El Caribe

Horizon / Pleins textes

HAL-Pasteur

A probabilistic model for gene content evolution with duplication, loss, and horizontal transfer

Author: A.B. Simonson
B. Boussau
B. Snel
B. Snel
B.E. Dutilh
B.G. Mirkin
C. Pál
C.G. Kurland
D.H. Huson
E. Belda
E.A. Herniou
E.D. Green
E.J. Deeds
E.L.L. Sonnhammer
E.V. Koonin
F. Delsuc
F. Tekaia
G.D.P. Clarke
G.P. Karev
G.P. Karev
G.P. Karev
I.K. Jordan
J. Lin
J.A. Lake
J.O. Korbel
J.P. Gogarten
J.T. Herbeck
K.H. Wolfe
M. Csűrös
M. Pellegrini
M.G. Montague
M.W. Hahn
R.L. Tatusov
S. Karlin
S. Yang
S.T. Fitz-Gibbon
T. Pupko
V. Kunin
V. Kunin
W. Feller
W.J. Reed
X. Gu
Y. Boucher
Y.I. Wolf
Publication venue: 'Springer Science and Business Media LLC'
Publication date: 27/09/2005
Field of study

We introduce a Markov model for the evolution of a gene family along a phylogeny. The model includes parameters for the rates of horizontal gene transfer, gene duplication, and gene loss, in addition to branch lengths in the phylogeny. The likelihood for the changes in the size of a gene family across different organisms can be calculated in O(N+hM^2) time and O(N+M^2) space, where N is the number of organisms,

h

is the height of the phylogeny, and M is the sum of family sizes. We apply the model to the evolution of gene content in Preoteobacteria using the gene families in the COG (Clusters of Orthologous Groups) database

arXiv.org e-Print Archive

CiteSeerX

Crossref

Topological network alignment uncovers biological function and phylogeny

Author: Cook S.
Flannick J.
Kuchaiev O.
Kuchaiev O.
Memišević V.
Nataša Pržulj
Oleksii Kuchaiev
Pržulj N.
Singh R.
Singh R.
Snijders T. A.
Tijana Milenković
Vesna Memišević
Wayne Hayes
Wentz-Hunter K.
Zhang Y.
Publication venue
Publication date: 07/10/2009
Field of study

Sequence comparison and alignment has had an enormous impact on our understanding of evolution, biology, and disease. Comparison and alignment of biological networks will likely have a similar impact. Existing network alignments use information external to the networks, such as sequence, because no good algorithm for purely topological alignment has yet been devised. In this paper, we present a novel algorithm based solely on network topology, that can be used to align any two networks. We apply it to biological networks to produce by far the most complete topological alignments of biological networks to date. We demonstrate that both species phylogeny and detailed biological function of individual proteins can be extracted from our alignments. Topology-based alignments have the potential to provide a completely new, independent source of phylogenetic information. Our alignment of the protein-protein interaction networks of two very different species--yeast and human--indicate that even distant species share a surprising amount of network topology with each other, suggesting broad similarities in internal cellular wiring across all life on Earth.Comment: Algorithm explained in more details. Additional analysis adde

arXiv.org e-Print Archive

Crossref

PubMed Central

UCL Discovery

Probabilistic methods in the analysis of protein interaction networks

Author: Thorne Thomas
Thorne Thomas
Publication venue
Publication date: 01/01/2010
Field of study

Imperial Users onl

Spiral - Imperial College Digital Repository

Genome annotation, comparative genomics and evolution of the model grass genus Brachypodium (Poaceae)

Author: Catalán Rodríguez Pilar
Contreras Moreira Bruno
Sancho Cohen Rubén
Publication venue: Universidad de Zaragoza, Prensas de la Universidad
Publication date: 01/01/2018
Field of study

INTRODUCCIÓNEn esta Tesis Doctoral se han llevado a cabo estudios evolutivos, biogeográficos, genómicos, transcriptómicos y de expresión génica en los taxones que integran el género Brachypodium (Poaceae) con el objetivo de descifrar los eventos de especiación que han dado lugar a las especies de dicho género. La tesis está constituida por cuatro capítulos con sus respectivos cuatro apéndices. DESARROLLO TEÓRICOCapítulo 1. Reconstrucción de los orígenes y la biogeografía de los genomas de las especies del género modelo de gramíneas Brachypodium, altamente reticulado y rico en especies alopoliploides, mediante métodos de evolución mínima, coalescencia y máxima verosimilitud (Reconstructing the origins and the biogeography of species’ genomes in the highly reticulate allopolyploid-rich model grass genus Brachypodium using minimum evolution, coalescence and maximum likelihood approaches).Se ha reconstruido la filogenia y la historia biogeográfica de las especies reconocidas de Brachypodium mediante el análisis evolutivo del gen nuclear copia simple GIGANTEA (GI), y de otros genes tanto nucleares (ITS, ETS) como plastídicos (ndhF, trnL-F). Para ello se han desarrollado análisis de redes haplotípicas, de mapeo de los alelos poliploides en el árbol de especies diploides por evolución mínima y de construcción del árbol de especies (de genomas y subgenomas), así como la reconstrucción biogeográfica y el cálculo de los tiempos de divergencia de los subgenomas homeólogos por métodos máximo verosímiles y bayesianos, respectivamente, y la estimación por coalescencia de los posibles tiempos en los que se produjeron los eventos de hibridación que dieron lugar a las especies alopoliploides.Nuestros resultados apoyan la naturaleza alopoliploide de las especies poliploides del género, así como un escenario espacio-temporal de diversas divergencias y fusiones de los genomas en las diferentes áreas ancestrales, mostrando un claro predominio de la dispersión de los genomas diploides frente a los alopoliploides. También han sido inferidos los tiempos de divergencia de todas los linajes estudiados, desde el más ancestral, B. stacei (6,8 Ma) hasta los más recientes del “core perennial” (0,7-0,3 Ma).Capítulo 2. Mapeos sinténicos contra genomas de referencia y estudios filogenómicos basados en análisis multigénicos revelan los ancestros de los subgenomas homeologos de especies alopoliploides del género Brachypodium. (Reference-genome syntenic mapping and multigene-based phylogenomics reveal the ancestry of homeologous subgenomes in grass Brachypodium allopolyploids).Se llevaron a cabo mapeos sinténicos de datos transcriptómicos y de genotipado genómico (GBS) contra los genomas de referencia de Brachypodium desarrollando nuestros propios algoritmos y herramientas bioinformáticas. Con esos datos se ha reconstruido la filogenia y se han datado los orígenes de los genomas y subgenomas presentes en especies diploides y alopoliploides de Brachypodium empleando métodos bayesianos y de máxima verosimilitud. Adicionalmente, se ha obtenido y analizado el pan-transcriptoma de las especies estudiadas, identificando genes potencialmente exclusivos de determinados grupos de especies.Los análisis filogenéticos basados en datos transcriptómicos junto con la obtención de tamaños genómicos nos ha permitido elucidar complejos escenarios de hibridación para los subgenomas homeologos de las seis especies alopoliploides de Brachypodium estudiadas, mostrando distintos eventos de hibridación que implican únicamente a genomas ancestrales, a genomas ancestrales y recientes, y únicamente a genomas recientes. Nuestros resultados apoyan el origen ancestral de B. mexicanum, el intermedio de B. boissieri y B. retusum, y la rápida radiación de las especies del “core perennial”.Los capítulos 1 y 2 suponen un completo análisis del género Brachypodium, en especial de las especies alopoliploides, cuyos resultados apoyan y datan los eventos evolutivos que han dado lugar a la compleja y reticulada historia evolutiva que presenta dicho género así como los posibles linajes progenitores de las especies alopoliploides. Capítulo 3. Genómica comparada del plastoma y filogenómica de Brachypodium: improntas de los tiempos de floración, introgresión y recombinación en los ecotipos recientemente evolucionados. (Comparative plastome genomics and phylogenomics of Brachypodium: flowering time signatures, introgression and recombination in recently diverged ecotypes).Se han ensamblado, anotado y analizado los genomas organulares (plastomas) de un amplio número de ecotipos de las especies anuales de Brachypodium, y se ha reconstruido su filogenia, comparándola con la de sus genomas nucleares. Se ha dilucidado la diversificación de los ecotipos y su relación con factores de tiempos de floración y geográficos. El estudio comparativo de los 57 genomas cloroplásticos ensamblados y anotados, 53 B. distachyon, 3 B. hybridum y 1 B. stacei, ha revelado reordenamientos genómicos, como la inserción de 1161 pb y la deleción de una de las copias del gen rps19, característicos de las especies B. stacei y B. hybridum (plastoma tipo stacei), respecto de las líneas de B. distachyon. Se han estimado sus orígenes mediante datación anidada dentro del marco evolutivo de las gramíneas y, para las líneas de B. distachyon, se ha comparado la filogenia plastómica con la nuclear, detectándose una divergencia clara de dos linajes intra-específicos, relacionada con sus tiempos de floración, y una subestructuración más reciente relacionada con su geografía, así como la evidencia de capturas cloroplásticas e introgresión entre clados distantes. Estos datos apoyan que la tendencia a la microespeciación se ve frenada por procesos de introgresión recurrente.Capítulo 4. Características de las redes de co-expresión y los genes diferencialmente expresados explican los patrones de respuesta a sequía en la gramínea modelo Brachypodium distachyon. (Co-expression network features and differentially expressed genes explain drought-response patterns in the model grass Brachypodium distachyon).Se han identificado y analizado genes funcionales implicados en la respuesta ambiental a estrés hídrico mediante el análisis de redes de co-expresión génica y de genes diferencialmente expresados en diversos ecotipos de la planta modelo Brachypodium distachyon.Se han analizado tanto la topología de dichas redes como los genes e isoformas más interconectadas, detectando 38 módulos en la red de co-expresión bajo condiciones de sequía, con 628 genes altamente interconectados (820 transcritos), y 30 módulos en la red de co-expresión en condiciones de riego con 839 genes altamente interconectados (1072 transcritos). Además se han identificado los procesos biológicos en los que están implicados los genes co-expresados, encontrando cinco módulos exclusivos de la red bajo condiciones de sequía de los cuales tres están directamente relacionados con procesos de respuesta a estrés hídrico. Estos resultados han sido correlacionados con datos pan-genómicos observando que la mayoría de los genes co-expresados son genes “core”, conservados en todos la líneas estudiadas, o “soft-core”, conservados en más del 90% de las líneas estudiadas.CONCLUSIONES1-Los análisis evolutivos y biogeográficos de los 20 taxones reconocidos del género Brachypodium empleando cinco genes (tres nucleares y dos plastídicos) indican que aproximadamente la mitad de las especies son diploides y la otra mitad alopoliploides. El análisis de evolución mínima de “injerto” de alelos alopoliploides en las ramas del árbol diploide recobra los linajes homeólogos (subgenomas) de los alopoliploides. Las sucesivas divergencias de los linajes de las diploides anuales (B. stacei, B. distachyon) tuvieron lugar durante el Mioceno tardío-Plioceno en la cuenca Mediterránea, mientras que las de los linajes de las diploides perennes (B. arbuscula, B. genuense, B. sylvaticum, B. glaucovirens, B. pinnatum-2x y B. rupestre-2x) ocurrieron durante el Cuaternario en las regiones Mediterránea y Euroasiática, con colonizaciones esporádicas de otros continentes. Las respectivas divergencias de los linajes homeólogos de los alopoliploides tuvieron lugar en distintos tiempos evolutivos. Nuestro escenario biogeográfico apoya la existencia de dispersiones a larga distancia únicamente en los linajes diploides, mientras que todos los eventos de hibridación y duplicación genómica ocurrieron dentro de las áreas ancestrales progenitoras más recientes, sin posteriores expansiones de área.2- Los análisis filogenómicos mediante datos de RNA-seq y GBS han identificado a B. mexicanum como la especie alopoliploide más antigua mostrando subgenomas de tipo ancestral (A) y materno de tipo stacei (B) (Mioceno medio-tardío). Los alopoliploides de elevado nivel de ploidía, B. boissieri y B. retusum, muestran tres y cuatro subgenomas respectivamente. Ambas especies presentan subgenomas A y B así como el subgenoma intermedio tipo distachyon (C) (Mioceno-Plioceno) (heredado maternalmente en B. boissieri). B. retusum también presenta un subgenoma materno tipo core perennial recientemente evolucionado (D) (Cuaternario). Los alotetraploides del clado core perennial B. rupestre y B. phoenicoides muestran únicamente subgenomas recientemente evolucionados tipo C y D (Cuaternario), siendo los diploides perennes B. pinnatum y B. sylvaticum sus respectivos progenitores maternos. El reciente alopoliploide B. hybridum se formó repetidamente y mediante cruzamientos bidireccionales durante el Cuaternario y es el único alopoliploide del que se conocen ambos progenitores diploides actuales, B. distachyon y B. stacei.3- Los análisis pan-transcriptómicos de 5202 conjuntos de tránscritos del género Brachypodium muestran genes expresados exclusivamente en los grupos de especies perennes (30), anuales (49), poliploides (14), alopoliploides más antiguos (143), especies ancestrales (14) y especies recientemente evolucionadas (52). Los tránscritos exclusivos de los alopoliploides antiguos podrían estar asociados con su genoma ancestral tipo A. Los tránscritos anotados como subunidad ARN polimerasa, encontrados únicamente en todas las especies anuales de Brachypodium, podrían indicar la existencia de diferencias en los niveles de expresión de las ARN polimerasas entre las especies anuales y perennes, o la pérdida de copias ancestrales en las especies perennes más recientemente evolucionadas.4- Los análisis pan-genómicos de los plastomas de 53 ecotipos de B. distachyon, 3 de B. hybridum y 1 de B. stacei han detectado una inserción (1161 pb) y una deleción en una de las copias del gen rps19 que diferencian a los plastomas de B. stacei y B. hybridum con respecto a los de B. distachyon, sin que se haya observado variación en el contenido génico entre los plastomas de B. distachyon.5- El árbol filogenómico de los plastomas de B. distachyon muestra la divergencia de dos linajes principales, correspondientes a los clados Extremely Delayed Flowering (EDF+) y Spanish (S+) – Turkish (T+), sugiriendo que el tiempo de floración es un factor decisivo en la divergencia intra-específica de B. distachyon. La comparación topológica entre las filogenias nucleares y plastídicas de esta especie revela nueve eventos de captura cloroplástica y dos de introgresión y micro-recombinación entre esos clados, apoyando la existencia de flujo génico entre linajes previamente aislados. Los intercambios de plastomas entre los tres grupos, EDF+, T+, S+, probablemente hayan sido el resultado de retro-cruzamientos aleatorios seguidos de estabilización por presión selectiva.6- Los análisis mediante redes ponderadas de co-expresión génica llevados a cabo en 33 ecotipos de B. distachyon bajo condiciones de sequía y riego identificaron cinco módulos exclusivos de la red de sequía, incluyendo 465 isoformas y 11 genes altamente interconectados (hubs). El análisis seleccionó genes candidatos y factores de transcripción (bHLH, ABF1, MADS box) potencialmente implicados en la regulación de la respuesta a sequía, tales como la síntesis de prolina y las respuestas a carencias de agua o fosfato, así como a estímulos por temperatura. Los análisis de expresión diferencial de genes en los ecotipos han detectado 4941 tránscritos, de los cuales dos terceras partes están sobre-expresados en las plantas en condiciones de sequía con respecto a las sometidas a condiciones de riego. Los análisis pan-transcriptómicos muestran que la mayoría de los genes expresados en ambas condiciones son genes del core, presentes en todos los ecotipos estudiados, mientras que una fracción de los genes hub corresponden a genes soft-core y shell, encontrados únicamente en algunos ecotipos. <br /

Repositorio Universidad de Zaragoza

Optimized ancestral state reconstruction using Sankoff parsimony

Author: A Mazurie
AWF Edwards
B Kolaczkowski
BA Malcolm
BS Gaut
CV Forst
D Sankoff
D Sankoff
DA Shagin
DE Knuth
DL Swofford
DS Gladstein
F Ronquist
Gabriel Valiente
H Akashi
HW Ma
J Felsenstein
J Felsenstein
J Felsenstein
J Ma
J Wang
J Zhang
JC Clemente
José C Clemente
JP Huelsenbeck
JT Bridgham
JW Thornton
K Fan
Kazuho Ikeo
LR Murphy
M Cieplak
M Heymans
M Kanehisa
M Kimura
MK Kuhner
MS Waterman
N Saitou
NB Adey
NM Krishnan
PA Goloboff
PA Goloboff
PHA Sneath
RF Smith
T Tanaka
Takashi Gojobori
TH Jukes
WC Liu
WC Wheeler
WM Fitch
Y Inagaki
Y Tohsato
Z Jiang
ZS Yang
Publication venue: BioMed Central
Publication date: 01/01/2009
Field of study

Abstract Background Parsimony methods are widely used in molecular evolution to estimate the most plausible phylogeny for a set of characters. Sankoff parsimony determines the minimum number of changes required in a given phylogeny when a cost is associated to transitions between character states. Although optimizations exist to reduce the computations in the number of taxa, the original algorithm takes time <it>O</it>(<it>n</it>2) in the number of states, making it impractical for large values of <it>n</it>. Results In this study we introduce an optimization of Sankoff parsimony for the reconstruction of ancestral states when ultrametric or additive cost matrices are used. We analyzed its performance for randomly generated matrices, Jukes-Cantor and Kimura's two-parameter models of DNA evolution, and in the reconstruction of elongation factor-1<it>α </it>and ancestral metabolic states of a group of eukaryotes, showing that in all cases the execution time is significantly less than with the original implementation. Conclusion The algorithms here presented provide a fast computation of Sankoff parsimony for a given phylogeny. Problems where the number of states is large, such as reconstruction of ancestral metabolism, are particularly adequate for this optimization. Since we are reducing the computations required to calculate the parsimony cost of a single tree, our method can be combined with optimizations in the number of taxa that aim at finding the most parsimonious tree.</p

Crossref

Springer - Publisher Connector

Directory of Open Access Journals

PubMed Central