29 research outputs found

    Sampling solution traces for the problem of sorting permutations by signed reversals

    Get PDF
    International audienceBackgroundTraditional algorithms to solve the problem of sorting by signed reversals output just one optimal solution while the space of all optimal solutions can be huge. A so-called trace represents a group of solutions which share the same set of reversals that must be applied to sort the original permutation following a partial ordering. By using traces, we therefore can represent the set of optimal solutions in a more compact way. Algorithms for enumerating the complete set of traces of solutions were developed. However, due to their exponential complexity, their practical use is limited to small permutations. A partial enumeration of traces is a sampling of the complete set of traces and can be an alternative for the study of distinct evolutionary scenarios of big permutations. Ideally, the sampling should be done uniformly from the space of all optimal solutions. This is however conjectured to be ♯P-complete.ResultsWe propose and evaluate three algorithms for producing a sampling of the complete set of traces that instead can be shown in practice to preserve some of the characteristics of the space of all solutions. The first algorithm (RA) performs the construction of traces through a random selection of reversals on the list of optimal 1-sequences. The second algorithm (DFALT) consists in a slight modification of an algorithm that performs the complete enumeration of traces. Finally, the third algorithm (SWA) is based on a sliding window strategy to improve the enumeration of traces. All proposed algorithms were able to enumerate traces for permutations with up to 200 elements.ConclusionsWe analysed the distribution of the enumerated traces with respect to their height and average reversal length. Various works indicate that the reversal length can be an important aspect in genome rearrangements. The algorithms RA and SWA show a tendency to lose traces with high average reversal length. Such traces are however rare, and qualitatively our results show that, for testable-sized permutations, the algorithms DFALT and SWA produce distributions which approximate the reversal length distributions observed with a complete enumeration of the set of traces

    The study of plant genome evolution by means of phylogenomics

    Get PDF

    Evolutionary genomics : statistical and computational methods

    Get PDF
    This open access book addresses the challenge of analyzing and understanding the evolutionary dynamics of complex biological systems at the genomic level, and elaborates on some promising strategies that would bring us closer to uncovering of the vital relationships between genotype and phenotype. After a few educational primers, the book continues with sections on sequence homology and alignment, phylogenetic methods to study genome evolution, methodologies for evaluating selective pressures on genomic sequences as well as genomic evolution in light of protein domain architecture and transposable elements, population genomics and other omics, and discussions of current bottlenecks in handling and analyzing genomic data. Written for the highly successful Methods in Molecular Biology series, chapters include the kind of detail and expert implementation advice that lead to the best results. Authoritative and comprehensive, Evolutionary Genomics: Statistical and Computational Methods, Second Edition aims to serve both novices in biology with strong statistics and computational skills, and molecular biologists with a good grasp of standard mathematical concepts, in moving this important field of study forward

    A Multigenomic Approach to the Phylogeny, Evolution and Biogeography of the Grass Subfamily Pooideae with an Emphasis on the Subtribe Loliinae

    Get PDF
    INTRODUCCIÓN El principal foco de interés de la presente tesis ha sido explorar diversos procesos de duplicación, recombinación, pseudogenización, conversiones génicas y poliploidización en las gramíneas (Poaceae), poniendo un mayor énfasis en la subfamilia Pooideae. Para ello hemos utilizado el análisis de genes nucleares, cloroplásticos y mitocondriales. Estos estudios, junto con la construcción de una robusta filogenia desde un enfoque molecular, la estimación de los tiempos de divergencia y los patrones biogeográficos históricos, logran explicar de lo micro a lo macroevolutivo la aparición de nuevos linajes de gramíneas templadas, y sus patrones de dispersión y de distribución histórica. En su conjunto, esta tesis doctoral ofrece una importante contribución en el campo de la sistemática molecular y evolutiva, logrando avances significativos y ofreciendo nuevas herramientas para el estudio de los genes en las plantas. La presente memoria doctoral está organizada en una introducción, los objetivos, cinco capítulos y las conclusiones finales. DESARROLLO TEÓRICO DE CADA CAPÍTULO En el primer capítulo se evalúa el potencial filogenético del gen nuclear copia simple ß-amylasa, así como la existencia de pseudogenización, paralogía, homeología, y recombinación dentro de una amplia representación de gramíneas (142 especies, 16 muestras de ellas clonadas, clasificadas en 88 géneros y 7 subfamilias). Para ello comparamos la filogenia basada en el gen ß-amylasa con una robusta filogenia organísmica de las gramíneas basada en genes nucleares (ITS) y cloroplásticos (matK, ndhF, trnTL, trnLF). Además, se usan las técnicas de detección de recombinación (RDP4) y detección de códones terminales prematuros (Premature Terminal Codons: PTCs), así como el modelo Branch-Specific Branch-Site REL (Random Effects Likelihood), que nos indica las posibles posiciones nucleotídicas bajo selección purificadora (negativa), neutral y positiva. Nuestros resultados demuestran la existencia de siete secuencias recombinantes y otras tantas bajo selección neutral y/o positiva, lo cual podría indicar la presencia de pseudogenes en el grupo de gramíneas analizado. También hemos descrito la presencia de semi-paralogía (clones de Vulpia alopecuros) y homeología (clones de Festuca simensis, F. fenas y F. arundinacea). Una vez analizadas y propiamente consideradas aquellas secuencias bajo una irregular dinámica evolutiva, el gen nuclear copia simple ß-amylasa resultó ser un buen candidato para resolver diversos conflictos filogenéticos pobremente resueltos hasta la fecha en las Poaceae. El segundo capítulo analiza la distribución y dinámica evolutiva de un tipo muy concreto de elementos transponibles, conocidos como Stowaway MITEs (Miniature Inverted repeat Transposable Elements). Dichos elementos transponibles fueron localizados en el cuarto intrón del gen nuclear copia simple ß-amylasa tras analizar muestras de 117 especies de gramíneas, que representaban a 88 géneros y 4 subfamilias, siendo la subfamilia Pooideae la más ampliamente muestreada. Para analizar la presencia de los Stowaway MITEs se realizó en primer lugar un árbol organísmico de Poaceae basado en genes nucleares (ITS, ß-amylasa) y cloroplásticos (trnTL, trnLF, ndhF y matK). A continuación se comparó la presencia de dichos elementos móviles con el marco filogenético aportado por el árbol organísmico. Nuestros resultados indican la presencia de hasta tres tipos distintos de Stowaway MITEs en el clado BEP de las gramíneas, y su llamativa ausencia de las muestras que representan al clado PACCMAD. Se describen tres hipótesis alternativas para explicar la dinámica evolutiva de dichos elementos en las gramíneas templadas: (i) su adquisición temprana en el ancestro de las Pooideae, seguido de múltiples e independientes pérdidas; (ii) inserciones independientes de hasta tres tipos distintos de ¿Stowaway MITEs¿ en diferentes ancestros en el mismo locus del gen ß-amylasa; (iii) una adquisición temprana de dichos elementos móviles en el ancestro común, seguidas por múltiples pérdidas, readquisiciones y transferencias horizontales a lo largo de la historia del clado BEP. Este capítulo ha sido publicado: Minaya, M., Pimentel, M., Mason-Gamer, R., Catalan, P., 2013. Distribution and evolutionary dynamics of Stowaway Miniature Inverted repeat Transposable Elements (MITEs) in grasses. Molecular Phylogenetics and Evolution 68, 106-118. El tercer capítulo aborda uno de los más recientemente descritos y trascendentales procesos evolutivos en las angiospermas: la transferencia de secuencias génicas entre especies alejadas filogenéticamente o transferencia horizontal de genes (HGT). Para llevar a cabo esta tarea se secuenció parte del gen mitocondrial rps3 en 141 especies de gramíneas, las cuales representaban a 97 géneros y 10 subfamilias. Al igual que en los capítulos anteriores, se comparó la filogenia basada en el gen rps3 con una robusta filogenia organísmica de las gramíneas basada en genes nucleares (ITS, ß-amylasa) y cloroplásticos (matK, ndhF, trnTL and trnLF). Se llevaron a cabo técnicas de detección de recombinación mediante inspecciones visuales y usando programas informáticos específicos como RDP4. También se estimó la existencia de pseudogenización mediante la localización visual de códones terminales prematuros (PTCs), y del modelo Branch-Specific Branch-Site REL. Nuestros resultados indican la presencia de hasta 32 recombinaciones (incluyendo 12 casos de micro-conversiones génicas), y 13 secuencias con una alta proporción de sitios bajo selección positiva y/o neutral. Estos resultados demuestran la naturaleza quimérica del marcador mitocondrial analizado y de su plausible transferencia horizontal entre linajes no emparentados. Estas evidencias también sugieren que la transferencia desde el genoma mitocondrial al genoma nuclear y/o cloroplástico del gen mitocondrial rps3 en gramíneas. El contenido del cuarto capítulo, además de seguir explorando la filogenia de la subfamilia Pooideae, incide en la evolución cromosómica y el ritmo de divergencia y las tasas de diversificación en los linajes de Poaceae. Para ello se secuenciaron cinco regiones cloroplásticas, dos codificantes (ndhF, matk) y tres no codificantes (trnH-psbA, trnTL y trnLF) en una selección de 170 especies de gramíneas, representativas de 9 subfamilias de Poaceae. La evolución cromosómica fue analizada mediante el programa chromEvol, que utiliza el método máximo-verosímil, los tiempos de divergencia fueron estimados en el programa bayesiano BEAST, y las tasas de diversificación fueron evaluados con el programa MEDUSA. Los resultados filogenéticos corroboraron otras reconstrucciones recientes de Poaceae e indicaron que las Pooideae comenzaron su diversificación en el Eoceno medio, lo cual podría estar relacionado con el descenso de temperatura global detectado a partir de esa época. Los análisis sobre la evolución del número de cromosomas mostraron que el número de cromosomas permanece estable a través de la filogenia de las Pooideas. Además, nuestros resultados indican que la evolución poliploide ha sido predominante sobre la diploide, lo cual contradice las hipótesis postuladas recientemente para diversas angiospermas. El quinto y último capítulo de esta tesis doctoral explora la filogenia, los tiempos de divergencia calibrados con dataciones fósiles y los patrones biogeográficos históricos en Loliinae (Pooideae), con un especial enfoque en las regiones australes más pobremente estudiadas hasta la fecha (Sudamérica, África tropical, Sudáfrica, Australia y Nueva Zelanda). Este trabajo utilizó aproximaciones bayesianas (BEAST) para la estimación de los tiempos de divergencia y métodos de reconstrucción biogeográfica mediante análisis de dispersión, extinción, y cladogénesis (DEC models). Se utilizaron secuencias del gen nuclear (ITS) y de los genes cloroplásticos (trnTL, trnLF) en 178 especies de Loliinae. Nuestros resultados sugieren que el ancestro común de las Loliinae apareció durante el Oligoceno tardío, lo que supone un adelanto con respecto a las últimas estimaciones publicadas. La mayor parte de las divergencias estimadas en los principales linajes de Loliinae ocurrieron entre el Mioceno medio y el inferior. Los escenarios biogeográficos estimados sugieren la existencia de recurrentes dispersiones a larga distancia (Long Distance Dispersions; LDD), neocolonizaciones y recolonizaciones, principalmente desde el hemisferio norte al hemisferio sur, pero también en dirección opuesta, y entre áreas situadas en el hemisferio sur. Nuestras inferencias indican que las Loliinae de hoja ancha (broad-leaved Loliinae) presentan un ancestro común originario del Mediterraneao occidental. Sin embargo, las Loliinae de hoja fina (fine-leaved Loliinae) se originaron de forma independiente en el Mediterráneo occidental y en Sudamérica. CONCLUSIONES GENERALES La compleja y singular dinámica evolutiva del gen nuclear copia simple (LCNG) ß-amylase y del gen mitocondrial rps3 en Poaceae ha sido corroborada a través de la detención de multitud de secuencias bajo pseudogenización, paralogía, homeología, recombinación y desplazamientos filogenéticos. La existencia de MITEs (Miniature Inverted Repeat Transposable Elements) en regiones intrónicas y espacios intergénicos de los genes ß-amylase, Xylose isomerase (xly), Barley leucine zipper (blz-1), Nucellin (nuc) y Disrupted meiotic cDNA (dmc1) nos ayuda a interpretar la compleja dinámica evolutiva del genoma nuclear de las gramíneas, el cual ha resultado ser mucho más complejo e intrincado de lo esperado. La hipótesis más plausible que explica la existencia de dichos elementos transponibles dentro de las Loliinae templadas es su adquisición independiente en diferentes momentos, seguida de múltiples pérdidas y transferencias horizontales. La identificación y evaluación de genes y secuencias bajo recombinación y con una presión evolutiva negativa es un paso clave en el uso de marcadores moleculares como fuente de datos en reconstrucciones filogenéticas. La existencia de dichos singulares eventos evolutivos ha resultado ser mucho más común de lo esperado en gramíneas. Quizá estemos en los albores de entender que el modelo de evolución génica en plantas, actualmente limitado a especiaciones, duplicaciones y pérdidas de genes, es mucho más amplio debiéndose incorporar a la rutina investigadora fenómenos como microconversiones, o transferencias horizontales de genes entre especies alejadas filogenéticamente. Las filogenias presentadas en esta tesis, basadas en marcadores nucleares (ITS, ß-amylase) y plastídicos (matK, ndhF, trnH-psbA, trnTL and trnLF), fueron en general altamente congruentes con los trabajos publicados hasta la fecha. Cabe destacar las nueva relación observada entre Brachypodieae + core pooids clade, y los cinco nuevos linages descritos correspondientes mayormente a Loliinae Australes: el clado Euroasiatico ¿ Sur Americano, el clado sur Africano ¿ centro Americano, el clado de Africa tropical ¿ sur Africano, el clado de Vulpias Americanas + Pampas, y el clado Afroalpino. Las dataciones de Pooideae calibradas con fósiles indican que la diversificación más temprana dentro del clado BEP ocurrió entre el Paleoceno medio y el Eoceno temprano. Dichas diversificaciones parecen estar relacionadas con un periodo de calentamiento global. Sin embargo, el desarrollo de un clima más frío y seco durante el Eoceno tardío y el Oligoceno favoreció la diversificación de las Pooideae debido probablemente a la formación de grandes espacios abiertos en forma de prados y praderas. Nuestras estimaciones indican que la subtribu Loliinae se originó durante el Oligoceno tardío, y divergió fundamentalmente durante el Mioceno medio y el tardío. Los escenarios biogeográficos reconstruidos para la subtribu Loliinae sugieren que la mayor parte de sus ancestros se dispersaron mediante neocolonizaciones, recolonizaciones y migraciones a larga distancia desde el hemisferio norte al sur, pero también en dirección opuesta e incluso dentro del hemisferio sur. Las ¿festucas de hoja ancha¿ presentaron un inequívoco ancestro común en el Mediterráneo occidental. Sin embargo, el grupo de las festucas de hoja fina muestran dos orígenes independientes: el Mediterráneo occidental y la región Patagónica

    Predicting the flavour and SUSY flavour structure from grand unified theories

    Get PDF
    Grand Unified Theories (GUTs) offer an attractive framework for flavour models, since they feature relations between quarks and leptons. Combining them with Supersymmetry (SUSY) and flavour symmetries, we derive predictions for the flavour and SUSY flavour structure from various GUT models and discuss how the double missing partner mechanism (DMPM) solution to the doublet-triplet splitting problem can be combined with predictions for GUT scale quark-lepton Yukawa coupling relations. We construct two predictive SUSY SU(5) GUT models with an A4 flavour symmetry, that feature realistic quark-lepton Yukawa coupling ratios and mixing angle relations. These GUT scale predictions arise after GUT symmetry breaking from a novel combination of group theoretical Clebsch-Gordan factors, and we carefully construct additional shaping symmetries and renormalisable messenger sectors to protect the models' predictions from dangerous corrections. The major difference between both models are their respective predictions of a normal and inverse neutrino mass ordering. We perform Markov Chain Monte Carlo analyses, fit to experimental data, and discuss how the models can be tested by present and future experiments. To combine predictive GUT scale quark-lepton Yukawa coupling ratios with the DMPM in SUSY SU(5), we introduce a second GUT breaking Higgs field in the adjoint representation. Two explicit flavour models with different predictions for the GUT scale Yukawa sector are presented, including shaping symmetries and renormalisable messenger sectors, and combined with the DMPM. We calculate the effective masses of the colour triplets mediating proton decay and find that they can be made sufficiently heavy. In SUSY theories, the one-loop SUSY threshold corrections are of particular importance in investigating GUT scale quark-lepton mass relations and thus link a given GUT flavour model to the sparticle spectrum. We calculate the one-loop SUSY threshold corrections of the full MSSM Yukawa coupling matrices in the electroweak-unbroken phase and introduce a new software tool SusyTC as a major extension to the Mathematica package REAP. Finally we find predictions for the CMSSM parameters and sparticle masses from the GUT scale Yukawa coupling ratios used in the flavour models of this thesis
    corecore