2,632 research outputs found

    La filosofía open source en la bioinformática

    Get PDF
    5 Pag., 2 Fig., 2 Fot.Desde hace una década el fenómeno open source o código abierto ha explotado y sus efectos se pueden ver en todas partes y también en la ciencia. Este modelo de software se centra en los beneficios prácticos de compartir el código, más allá de cuestiones morales y filosóficas. Así, en la ciencia, los programas open source permiten que investigadores de todo el mundo pongan a prueba e incluso mejoren soluciones a problemas científicos, como si fueran experimentos a escala global.Bruno Contreras Moreira es Investigador de la Fundación ARAID y desarrolla su trabajo en el Laboratorio de Biología Computacional, Estación Experimental de Aula Dei (Zaragoza), perteneciente al CSIC.Peer reviewe

    FootprintDB: Analysis of plant cis-regulatory elements, transcription factors, and binding interfaces

    Get PDF
    28 Pags.- 8 Figs. The definitive version is available at: http://link.springer.com/bookseries/7651 and http://link.springer.com/book/10.1007/978-1-4939-6396-6.FootprintDB is a database and search engine that compiles regulatory sequences from open access libraries of curated DNA cis-elements and motifs, and their associated transcription factors (TFs). It systematically annotates the binding interfaces of the TFs by exploiting protein-DNA complexes deposited in the Protein Data Bank. Each entry in footprintDB is thus a DNA motif linked to the protein sequence of the TF(s) known to recognize it, and in most cases, the set of predicted interface residues involved in specific recognition. This chapter explains step-by-step how to search for DNA motifs and protein sequences in footprintDB and how to focus the search to a particular organism. Two real-world examples are shown where this software was used to analyze transcriptional regulation in plants. Results are described with the aim of guiding users on their interpretation, and special attention is given to the choices users might face when performing similar analyzes.This work was funded by grant Euroinvestigación EUI2008-03612 under the framework of the Transnational (Germany, France, Spain) Cooperation within the PLANT-KBBE Initiative.Peer reviewe

    Large differences in gene expression responses to drought and heat stress between elite barley cultivar scarlett and a spanish landrace

    Get PDF
    23 Pags.- 6 Tabls.- 8 Figs. Copyright © 2017 Cantalapiedra, García-Pereira, Gracia, Igartua, Casas and Contreras-Moreira. This is an open-access article distributed under the terms of the Creative Commons Attribution License (CC BY). The use, distribution or reproduction in other forms is permitted, provided the original author(s) or licensor are credited and that the original publication in this journal is cited, in accordance with accepted academic practice. No use, distribution or reproduction is permitted which does not comply with these terms.Drought causes important losses in crop production every season. Improvement for drought tolerance could take advantage of the diversity held in germplasm collections, much of which has not been incorporated yet into modern breeding. Spanish landraces constitute a promising resource for barley breeding, as they were widely grown until last century and still show good yielding ability under stress. Here, we study the transcriptome expression landscape in two genotypes, an outstanding Spanish landrace-derived inbred line (SBCC073) and a modern cultivar (Scarlett). Gene expression of adult plants after prolonged stresses, either drought or drought combined with heat, was monitored. Transcriptome of mature leaves presented little changes under severe drought, whereas abundant gene expression changes were observed under combined mild drought and heat. Developing inflorescences of SBCC073 exhibited mostly unaltered gene expression, whereas numerous changes were found in the same tissues for Scarlett. Genotypic differences in physiological traits and gene expression patterns confirmed the different behavior of landrace SBCC073 and cultivar Scarlett under abiotic stress, suggesting that they responded to stress following different strategies. A comparison with related studies in barley, addressing gene expression responses to drought, revealed common biological processes, but moderate agreement regarding individual differentially expressed transcripts. Special emphasis was put in the search of co-expressed genes and underlying common regulatory motifs. Overall, 11 transcription factors were identified, and one of them matched cis-regulatory motifs discovered upstream of co-expressed genes involved in those responses.This work was funded by DGA - Obra Social La Caixa [grant number GA-LC-059-2011] and by the Spanish Ministry of Economy and Competitiveness [projects AGL2010-21929, RFP-2012-00015-00-00 AGL2013-48756-R and AGL2016-80967-R]. Carlos P. Cantalapiedra is funded by [grant BES-2011-045905 linked to project AGL2010-21929].Peer reviewe

    Structural (and sequence-based) analysis of transcriptional regulation

    Get PDF
    Most computational approaches to transcriptional regulation use sequence-based methodologies, that aim to discover regulatory motifs in genomic segments. Here we argue that the current content of the Protein Data Bank (PDB) can provide invaluable data that drive the prediction of regulatory interactions within genomes. First, we dissect protein-DNA interfaces and find atomic interactions that contribute to sequence-specific recognition, mainly hydrogen bonds and Van derWaals contacts. These specificity determinants can be expressed in terms of atomic weight matrices, that are shown to be robust in bootstrap experiments and yield scores that correlate with approximate measures of binding specificity. Second, using example transcription factors from Escherichia coli we find that some protein-DNA interfaces have sequence-dependent DNA geometries that constitute indirect readout mechanisms, in agreement with previous reports. Third, we are able to build structure-based position weight matrices that capture both types of recognition mechanisms and test them in genomic experiments, with results comparable to sequence-based methodologies. We conclude that the PDB can be further exploited in exploring transcriptional regulation and other biological processes mediated by protein-DNA interactions.Funded by CSIC grant number 200720I038Peer reviewe

    Genome annotation, comparative genomics and evolution of the model grass genus Brachypodium (Poaceae)

    Get PDF
    INTRODUCCIÓNEn esta Tesis Doctoral se han llevado a cabo estudios evolutivos, biogeográficos, genómicos, transcriptómicos y de expresión génica en los taxones que integran el género Brachypodium (Poaceae) con el objetivo de descifrar los eventos de especiación que han dado lugar a las especies de dicho género. La tesis está constituida por cuatro capítulos con sus respectivos cuatro apéndices. DESARROLLO TEÓRICOCapítulo 1. Reconstrucción de los orígenes y la biogeografía de los genomas de las especies del género modelo de gramíneas Brachypodium, altamente reticulado y rico en especies alopoliploides, mediante métodos de evolución mínima, coalescencia y máxima verosimilitud (Reconstructing the origins and the biogeography of species’ genomes in the highly reticulate allopolyploid-rich model grass genus Brachypodium using minimum evolution, coalescence and maximum likelihood approaches).Se ha reconstruido la filogenia y la historia biogeográfica de las especies reconocidas de Brachypodium mediante el análisis evolutivo del gen nuclear copia simple GIGANTEA (GI), y de otros genes tanto nucleares (ITS, ETS) como plastídicos (ndhF, trnL-F). Para ello se han desarrollado análisis de redes haplotípicas, de mapeo de los alelos poliploides en el árbol de especies diploides por evolución mínima y de construcción del árbol de especies (de genomas y subgenomas), así como la reconstrucción biogeográfica y el cálculo de los tiempos de divergencia de los subgenomas homeólogos por métodos máximo verosímiles y bayesianos, respectivamente, y la estimación por coalescencia de los posibles tiempos en los que se produjeron los eventos de hibridación que dieron lugar a las especies alopoliploides.Nuestros resultados apoyan la naturaleza alopoliploide de las especies poliploides del género, así como un escenario espacio-temporal de diversas divergencias y fusiones de los genomas en las diferentes áreas ancestrales, mostrando un claro predominio de la dispersión de los genomas diploides frente a los alopoliploides. También han sido inferidos los tiempos de divergencia de todas los linajes estudiados, desde el más ancestral, B. stacei (6,8 Ma) hasta los más recientes del “core perennial” (0,7-0,3 Ma).Capítulo 2. Mapeos sinténicos contra genomas de referencia y estudios filogenómicos basados en análisis multigénicos revelan los ancestros de los subgenomas homeologos de especies alopoliploides del género Brachypodium. (Reference-genome syntenic mapping and multigene-based phylogenomics reveal the ancestry of homeologous subgenomes in grass Brachypodium allopolyploids).Se llevaron a cabo mapeos sinténicos de datos transcriptómicos y de genotipado genómico (GBS) contra los genomas de referencia de Brachypodium desarrollando nuestros propios algoritmos y herramientas bioinformáticas. Con esos datos se ha reconstruido la filogenia y se han datado los orígenes de los genomas y subgenomas presentes en especies diploides y alopoliploides de Brachypodium empleando métodos bayesianos y de máxima verosimilitud. Adicionalmente, se ha obtenido y analizado el pan-transcriptoma de las especies estudiadas, identificando genes potencialmente exclusivos de determinados grupos de especies.Los análisis filogenéticos basados en datos transcriptómicos junto con la obtención de tamaños genómicos nos ha permitido elucidar complejos escenarios de hibridación para los subgenomas homeologos de las seis especies alopoliploides de Brachypodium estudiadas, mostrando distintos eventos de hibridación que implican únicamente a genomas ancestrales, a genomas ancestrales y recientes, y únicamente a genomas recientes. Nuestros resultados apoyan el origen ancestral de B. mexicanum, el intermedio de B. boissieri y B. retusum, y la rápida radiación de las especies del “core perennial”.Los capítulos 1 y 2 suponen un completo análisis del género Brachypodium, en especial de las especies alopoliploides, cuyos resultados apoyan y datan los eventos evolutivos que han dado lugar a la compleja y reticulada historia evolutiva que presenta dicho género así como los posibles linajes progenitores de las especies alopoliploides. Capítulo 3. Genómica comparada del plastoma y filogenómica de Brachypodium: improntas de los tiempos de floración, introgresión y recombinación en los ecotipos recientemente evolucionados. (Comparative plastome genomics and phylogenomics of Brachypodium: flowering time signatures, introgression and recombination in recently diverged ecotypes).Se han ensamblado, anotado y analizado los genomas organulares (plastomas) de un amplio número de ecotipos de las especies anuales de Brachypodium, y se ha reconstruido su filogenia, comparándola con la de sus genomas nucleares. Se ha dilucidado la diversificación de los ecotipos y su relación con factores de tiempos de floración y geográficos. El estudio comparativo de los 57 genomas cloroplásticos ensamblados y anotados, 53 B. distachyon, 3 B. hybridum y 1 B. stacei, ha revelado reordenamientos genómicos, como la inserción de 1161 pb y la deleción de una de las copias del gen rps19, característicos de las especies B. stacei y B. hybridum (plastoma tipo stacei), respecto de las líneas de B. distachyon. Se han estimado sus orígenes mediante datación anidada dentro del marco evolutivo de las gramíneas y, para las líneas de B. distachyon, se ha comparado la filogenia plastómica con la nuclear, detectándose una divergencia clara de dos linajes intra-específicos, relacionada con sus tiempos de floración, y una subestructuración más reciente relacionada con su geografía, así como la evidencia de capturas cloroplásticas e introgresión entre clados distantes. Estos datos apoyan que la tendencia a la microespeciación se ve frenada por procesos de introgresión recurrente.Capítulo 4. Características de las redes de co-expresión y los genes diferencialmente expresados explican los patrones de respuesta a sequía en la gramínea modelo Brachypodium distachyon. (Co-expression network features and differentially expressed genes explain drought-response patterns in the model grass Brachypodium distachyon).Se han identificado y analizado genes funcionales implicados en la respuesta ambiental a estrés hídrico mediante el análisis de redes de co-expresión génica y de genes diferencialmente expresados en diversos ecotipos de la planta modelo Brachypodium distachyon.Se han analizado tanto la topología de dichas redes como los genes e isoformas más interconectadas, detectando 38 módulos en la red de co-expresión bajo condiciones de sequía, con 628 genes altamente interconectados (820 transcritos), y 30 módulos en la red de co-expresión en condiciones de riego con 839 genes altamente interconectados (1072 transcritos). Además se han identificado los procesos biológicos en los que están implicados los genes co-expresados, encontrando cinco módulos exclusivos de la red bajo condiciones de sequía de los cuales tres están directamente relacionados con procesos de respuesta a estrés hídrico. Estos resultados han sido correlacionados con datos pan-genómicos observando que la mayoría de los genes co-expresados son genes “core”, conservados en todos la líneas estudiadas, o “soft-core”, conservados en más del 90% de las líneas estudiadas.CONCLUSIONES1-Los análisis evolutivos y biogeográficos de los 20 taxones reconocidos del género Brachypodium empleando cinco genes (tres nucleares y dos plastídicos) indican que aproximadamente la mitad de las especies son diploides y la otra mitad alopoliploides. El análisis de evolución mínima de “injerto” de alelos alopoliploides en las ramas del árbol diploide recobra los linajes homeólogos (subgenomas) de los alopoliploides. Las sucesivas divergencias de los linajes de las diploides anuales (B. stacei, B. distachyon) tuvieron lugar durante el Mioceno tardío-Plioceno en la cuenca Mediterránea, mientras que las de los linajes de las diploides perennes (B. arbuscula, B. genuense, B. sylvaticum, B. glaucovirens, B. pinnatum-2x y B. rupestre-2x) ocurrieron durante el Cuaternario en las regiones Mediterránea y Euroasiática, con colonizaciones esporádicas de otros continentes. Las respectivas divergencias de los linajes homeólogos de los alopoliploides tuvieron lugar en distintos tiempos evolutivos. Nuestro escenario biogeográfico apoya la existencia de dispersiones a larga distancia únicamente en los linajes diploides, mientras que todos los eventos de hibridación y duplicación genómica ocurrieron dentro de las áreas ancestrales progenitoras más recientes, sin posteriores expansiones de área.2- Los análisis filogenómicos mediante datos de RNA-seq y GBS han identificado a B. mexicanum como la especie alopoliploide más antigua mostrando subgenomas de tipo ancestral (A) y materno de tipo stacei (B) (Mioceno medio-tardío). Los alopoliploides de elevado nivel de ploidía, B. boissieri y B. retusum, muestran tres y cuatro subgenomas respectivamente. Ambas especies presentan subgenomas A y B así como el subgenoma intermedio tipo distachyon (C) (Mioceno-Plioceno) (heredado maternalmente en B. boissieri). B. retusum también presenta un subgenoma materno tipo core perennial recientemente evolucionado (D) (Cuaternario). Los alotetraploides del clado core perennial B. rupestre y B. phoenicoides muestran únicamente subgenomas recientemente evolucionados tipo C y D (Cuaternario), siendo los diploides perennes B. pinnatum y B. sylvaticum sus respectivos progenitores maternos. El reciente alopoliploide B. hybridum se formó repetidamente y mediante cruzamientos bidireccionales durante el Cuaternario y es el único alopoliploide del que se conocen ambos progenitores diploides actuales, B. distachyon y B. stacei.3- Los análisis pan-transcriptómicos de 5202 conjuntos de tránscritos del género Brachypodium muestran genes expresados exclusivamente en los grupos de especies perennes (30), anuales (49), poliploides (14), alopoliploides más antiguos (143), especies ancestrales (14) y especies recientemente evolucionadas (52). Los tránscritos exclusivos de los alopoliploides antiguos podrían estar asociados con su genoma ancestral tipo A. Los tránscritos anotados como subunidad ARN polimerasa, encontrados únicamente en todas las especies anuales de Brachypodium, podrían indicar la existencia de diferencias en los niveles de expresión de las ARN polimerasas entre las especies anuales y perennes, o la pérdida de copias ancestrales en las especies perennes más recientemente evolucionadas.4- Los análisis pan-genómicos de los plastomas de 53 ecotipos de B. distachyon, 3 de B. hybridum y 1 de B. stacei han detectado una inserción (1161 pb) y una deleción en una de las copias del gen rps19 que diferencian a los plastomas de B. stacei y B. hybridum con respecto a los de B. distachyon, sin que se haya observado variación en el contenido génico entre los plastomas de B. distachyon.5- El árbol filogenómico de los plastomas de B. distachyon muestra la divergencia de dos linajes principales, correspondientes a los clados Extremely Delayed Flowering (EDF+) y Spanish (S+) – Turkish (T+), sugiriendo que el tiempo de floración es un factor decisivo en la divergencia intra-específica de B. distachyon. La comparación topológica entre las filogenias nucleares y plastídicas de esta especie revela nueve eventos de captura cloroplástica y dos de introgresión y micro-recombinación entre esos clados, apoyando la existencia de flujo génico entre linajes previamente aislados. Los intercambios de plastomas entre los tres grupos, EDF+, T+, S+, probablemente hayan sido el resultado de retro-cruzamientos aleatorios seguidos de estabilización por presión selectiva.6- Los análisis mediante redes ponderadas de co-expresión génica llevados a cabo en 33 ecotipos de B. distachyon bajo condiciones de sequía y riego identificaron cinco módulos exclusivos de la red de sequía, incluyendo 465 isoformas y 11 genes altamente interconectados (hubs). El análisis seleccionó genes candidatos y factores de transcripción (bHLH, ABF1, MADS box) potencialmente implicados en la regulación de la respuesta a sequía, tales como la síntesis de prolina y las respuestas a carencias de agua o fosfato, así como a estímulos por temperatura. Los análisis de expresión diferencial de genes en los ecotipos han detectado 4941 tránscritos, de los cuales dos terceras partes están sobre-expresados en las plantas en condiciones de sequía con respecto a las sometidas a condiciones de riego. Los análisis pan-transcriptómicos muestran que la mayoría de los genes expresados en ambas condiciones son genes del core, presentes en todos los ecotipos estudiados, mientras que una fracción de los genes hub corresponden a genes soft-core y shell, encontrados únicamente en algunos ecotipos. <br /

    Evolution of Protein Ductility in Duplicated Genes of Plants

    Get PDF
    Previous work has shown that ductile/intrinsically disordered proteins (IDPs) and residues (IDRs) are found in all unicellular and multicellular organisms, wherein they are essential for basic cellular functions and complement the function of rigid proteins. In addition, computational studies of diverse phylogenetic lineages have revealed: (1) that protein ductility increases in concert with organismic complexity, and (2) that distributions of IDPs and IDRs along the chromosomes of plant species are non-random and correlate with variations in the rates of the genetic recombination and chromosomal rearrangement. Here, we show that approximately 50% of aligned residues in paralogs across a spectrum of algae, bryophytes, monocots, and eudicots are IDRs and that a high proportion (ca. 60%) are in disordered segments greater than 30 residues. When three types of IDRs are distinguished (i.e., identical, similar and variable IDRs) we find that species with large numbers of chromosome and endoduplicated genes exhibit paralogous sequences with a higher frequency of identical IDRs, whereas species with small chromosomes numbers exhibit paralogous sequences with a higher frequency of similar and variable IDRs. These results are interpreted to indicate that genome duplication events influence the distribution of IDRs along protein sequences and likely favor the presence of identical IDRs (compared to similar IDRs or variable IDRs). We discuss the evolutionary implications of gene duplication events in the context of ductile/disordered residues and segments, their conservation, and their effects on functionality

    Evolution of Protein Ductility in Duplicated Genes of Plants

    Get PDF
    Previous work has shown that ductile/intrinsically disordered proteins (IDPs) and residues (IDRs) are found in all unicellular and multicellular organisms, wherein they are essential for basic cellular functions and complement the function of rigid proteins. In addition, computational studies of diverse phylogenetic lineages have revealed: (1) that protein ductility increases in concert with organismic complexity, and (2) that distributions of IDPs and IDRs along the chromosomes of plant species are non-random and correlate with variations in the rates of the genetic recombination and chromosomal rearrangement. Here, we show that approximately 50% of aligned residues in paralogs across a spectrum of algae, bryophytes, monocots, and eudicots are IDRs and that a high proportion (ca. 60%) are in disordered segments greater than 30 residues. When three types of IDRs are distinguished (i.e., identical, similar and variable IDRs) we find that species with large numbers of chromosome and endoduplicated genes exhibit paralogous sequences with a higher frequency of identical IDRs, whereas species with small chromosomes numbers exhibit paralogous sequences with a higher frequency of similar and variable IDRs. These results are interpreted to indicate that genome duplication events influence the distribution of IDRs along protein sequences and likely favor the presence of identical IDRs (compared to similar IDRs or variable IDRs). We discuss the evolutionary implications of gene duplication events in the context of ductile/disordered residues and segments, their conservation, and their effects on functionality

    Evolutionary divergence of chloroplast FAD synthetase proteins

    Get PDF
    <p>Abstract</p> <p>Background</p> <p>Flavin adenine dinucleotide synthetases (FADSs) - a group of bifunctional enzymes that carry out the dual functions of riboflavin phosphorylation to produce flavin mononucleotide (FMN) and its subsequent adenylation to generate FAD in most prokaryotes - were studied in plants in terms of sequence, structure and evolutionary history.</p> <p>Results</p> <p>Using a variety of bioinformatics methods we have found that FADS enzymes localized to the chloroplasts, which we term as plant-like FADS proteins, are distributed across a variety of green plant lineages and constitute a divergent protein family clearly of cyanobacterial origin. The <it>C</it>-terminal module of these enzymes does not contain the typical riboflavin kinase active site sequence, while the <it>N</it>-terminal module is broadly conserved. These results agree with a previous work reported by Sandoval <it>et al</it>. in 2008. Furthermore, our observations and preliminary experimental results indicate that the <it>C-</it>terminus of plant-like FADS proteins may contain a catalytic activity, but different to that of their prokaryotic counterparts. In fact, homology models predict that plant-specific conserved residues constitute a distinct active site in the <it>C</it>-terminus.</p> <p>Conclusions</p> <p>A structure-based sequence alignment and an in-depth evolutionary survey of FADS proteins, thought to be crucial in plant metabolism, are reported, which will be essential for the correct annotation of plant genomes and further structural and functional studies. This work is a contribution to our understanding of the evolutionary history of plant-like FADS enzymes, which constitute a new family of FADS proteins whose <it>C</it>-terminal module might be involved in a distinct catalytic activity.</p

    ddRAD-seq para el análisis de asociación genómico de los principales caracteres agronómicos y calidad organoléptica en melocotonero

    Get PDF
    PósterDouble-digest RAD sequencing (ddRAD-Seq) is a powerful method for SNP discovery at a genome-wide scale. It relies on breaking the genome into a certain size of DNA fragments using two restriction enzymes: i) one common cutter with a short recognition site and ii) a low frequency cutter having a large recognition motif . Amplification step in library preparation can introduce PCR artefacts. Those are expected to skew allele frequency by increasing homozygosity leading to false genotype calls. In this context, we carried out a comparison study between DNA-variants generated with duplicates and those generated after removing with either "'SAMtools:rmdup" or "Stacks clone filter". On the other hand, the accuracy of genetic variants identification is a crucial step towards understanding phenotypical traits and monitoring breeding programs. Thereby, a good combination of computational tools for alignment and variant calling is crucial to tackle the possible artifacts. In response to this challenge, three variant callers (BCFtools, Freebayes and GATK-HaplotypeCaller) were combined on top of the BWA-mem read mapper. SNPs derived from the intersection of these callers were used for a genome wide association study to genetic variants associated with agronomic and organoleptic traits (In this poster, we illustrate only one study case trait). A diverse set of 90 peach accessions were sampled from the Experimental Station of Aula Dei (CSIC) located at Zaragoza (northern of Spain). This germplasm collection includes landraces and modem breeding lines from different origins.EEA San PedroFil: Ksouri, Najla. Consejo Superior de Investigaciones Científicas (CSIC). Estación Experimental Aula Dei; EspañaFil: Sánchez, Gerardo. Instituto Nacional de Tecnología Agropecuaria (INTA). Estación Experimental Agropecuaria San Pedro; ArgentinaFil: Contreras-Moreira, Bruno. Consejo Superior de Investigaciones Científicas (CSIC). Estación Experimental Aula Dei; EspañaFil: Gogorcena Aoiz, Yolanda. Consejo Superior de Investigaciones Científicas (CSIC). Estación Experimental Aula Dei; Españ
    corecore