3 research outputs found

    Unravelling Organelle Genome Transcription Using Publicly Available RNA-Sequencing Data

    Get PDF
    The study of organelles helped forge theories of genome evolution because of their unconventional genomes and gene expression regimes. The organelle genomics field (~35 years old) has seen the development of next generation sequencing (NGS) techniques and the consequent skyrocketing of genomic and transcriptomic data. However, these data are being underused in the studies of organelle genome transcription. My thesis investigates how NGS has affected the field of organelle genomics at both the DNA and RNA levels. First, I demonstrate that although organelle genomes are being sequenced as never before, they are un-characterized as they are published mostly as “organelle genome reports”. Then, I show that publicly available RNA-sequencing data represent an untapped datasource to study organelle genome transcription. I uncover the widespread pervasive transcription of organelle genomes across eukaryotes and speculate that this mechanism might have influenced the evolution of land plant terrestrialization and trophic mode determination in mixotrophs

    Edição de RNA plastidial em Glycine max: caracterização de sítios de edição, componentes do editossomo e efeitos de estresse abiótico

    Get PDF
    Soja, uma cultura conhecida por sua importância econômica e nutricional, tem sido objeto de vários estudos que avaliam o impacto e as respostas efetivas das plantas aos estresses abióticos. O estresse salino é um dos principais estresses ambientais e afeta negativamente o crescimento e o rendimento das culturas, incluindo a soja. A edição de RNA é um processo pelo qual as sequências de nucleotídeos podem ser alteradas, revertendo mutações que podem mudar as sequências de proteínas para manter suas funções conservadas. As proteínas pentatricopeptide repeat (PPRs) são trans-elementos de edição caracterizados por reconhecer cis-elementos específicos de RNA e realizar a reação de edição. Vários estudos descreveram estes trans-elementos e seus sítios de edição cognatos, mas nem todas as proteínas que compõem o complexo de edição foram identificadas. A perda de eventos de edição de plastídios, resultante de mutações em fatores de edição de RNA ou através de interferência por estresse, leva a alterações de desenvolvimento, de fisiologia e da fotossíntese. O objetivo do presente trabalho é caracterizar os sítios de edição e os fatores associados à edição de RNA em Glycine max e a influência de estresses abióticos no processo de edição de RNA em cloroplastos. No capítulo 1, um método é apresentado para triar a edição de RNA de cloroplasto usando bibliotecas públicas de sRNAs de Arabidopsis, soja e arroz. Entre os sítios de edição previstos, 40,57, 34,78 e 25,31% foram confirmados utilizando sRNAs de Arabidopsis, soja e arroz, respectivamente. A análise de SNPs revelou alterações de C-to-U de 58,2, 43,9 e 37,5% nas respectivas espécies e identificou conhecidas e possíveis novas edições de RNA de adenosina para inosina (A-to-I) em tRNAs. O método e os dados revelam o potencial do uso de sRNA como uma fonte confiável para identificar novos e confirmar sítios de edição conhecidos. No capítulo 2, o processo de edição de RNA foi avaliado em cloroplastos de plantas de soja sob estresse salino. A abordagem de bioinformática utilizando bibliotecas de sRNAs e mRNAs foi empregada para detectar sítios específicos que mostram diferenças na taxa de edição. RT-qPCR foi usado para medir a taxa de edição nos sítios selecionados. Observamos diferenças nas taxas de edição nos transcritos dos genes ndhA, ndhB, rps14 e rps16 ao comparar os dados das bibliotecas controle e das tratadas com NaCl. Os ensaios de RT-qPCR 9 demonstraram um aumento na edição dos genes selecionados. Esses aumentos podem ser uma resposta para manter a homeostase das funções das proteínas do cloroplasto em resposta ao estresse salino. No capítulo 3, para identificar os fatores relacionados aos sítios de edição analisados, sondas biotiniladas de RNA foram projetadas com base nos sítios de edição de RNA de plastídio de soja para realizar um isolamento proteico específico do fator de edição. Proteínas que interagiram com as sondas foram isoladas através da ligação das sondas à biotina e foram identificadas utilizando espectrometria de massa. Entre os peptídeos detectados, cinco corresponderam a proteínas PPR. A comparação dos genes de Arabidopsis com as proteínas PPR da soja permitiu a identificação dos homólogos mais próximos. O presente estudo representa a primeira identificação do conjunto de sítios de edição de RNA, de fatores associados aos sítios de edição de RNA e a caracterização dos efeitos do estresse abiótico na edição de RNA em Glycine max.Soybean, a crop known by its economic and nutritional importance, has been the subject of several studies that assess the impact and the effective plant responses to abiotic stresses. Salt stress is one of the main environmental stresses and negatively impacts crop growth and yield. RNA editing is a process whereby nucleotide sequences can be altered, reverting mutations that could change protein sequences to maintain their conserved functions. Pentatricopeptide repeat proteins are editing trans-elements characterized by recognize specific RNA cis-elements and perform the editing reaction. Several studies have described these trans-elements and their cognate editing sites, but not all proteins that compose the editing complex were identified. The loss of plastid editing events, resulting from mutations in RNA editing factors or through stress interference, leads to developmental, physiological and photosynthetic alterations. The aim of the present work is to characterize the editing sites and factors associated with RNA editing in Glycine max and the influence of abiotic stresses on the process of RNA editing in chloroplasts. In chapter 1, a method is presented to screen chloroplast RNA editing using public sRNA libraries from Arabidopsis, soybean and rice. Among the predicted editing sites, 40.57, 34.78, and 25.31% were confirmed using sRNAs from Arabidopsis, soybean and rice, respectively. SNP analysis revealed 58.2, 43.9, and 37.5% new C-to-U changes in the respective species and identified known and new putative adenosine to inosine (A-to-I) RNA editing in tRNAs. The method and data reveal the potential of sRNA as a reliable source to identify new and confirm known editing sites. In chapter 2, RNA editing process was evaluated in the chloroplast of soybean plants under salt stress. Bioinformatics approach using sRNA and mRNA libraries was employed to detect specific sites showing differences in editing efficiency. RT-qPCR was used to measure editing efficiency at selected sites. We observed differences in ndhA, ndhB, rps14 and rps16 editing rates between control and salt-treated libraries. RT-qPCR assays demonstrated an increase in editing efficiency of selected genes. These increases can be a response to keep the homeostasis of chloroplast protein functions in response to NaCl stress. In chapter 3, to identify the trans-acting factors of editing sites analyzed, we have designed RNA biotinylated probes based in soybean plastid RNA editing sites to perform 11 specific isolation of proteins associated to editosomes. Proteins that interacted with the probes were isolated by binding the probes to biotin and were identified using mass spectrometry. Among the detected peptides, five corresponded to PPR proteins. Comparison of Arabidopsis genes to the soybean PPR proteins allow identification of the closest related homologs. The present study represents the first identification of RNA editing sites set, associated factors to RNA editing sites and characterization of effects from abiotic stress in RNA editing in Glycine max

    Análise da diversidade molecular em Araucaria angustifolia a partir de sequências de microRNAs e do cloroplasto

    Get PDF
    Araucaria angustifolia, popularmente conhecida como Pinheiro do paraná, é a principal conífera endêmica do Brasil com importância comercial, destacando-se como a principal espécie madeireira da região Sul do país no século passado. Por apresentar madeira de excelente qualidade e alto valor comercial, esta espécie foi alvo de extrativismo predatório durante décadas, sofrendo um decréscimo populacional acentuado. Atualmente, A. angustifolia é classificada como espécie criticamente ameaçada de extinção. Esta espécie tem sido alvo de diversos estudos genéticos, principalmente com foco em embriogênese somática. Recentemente, uma análise transcriptômica em estágios iniciais de desenvolvimento foi realizada a partir de dados de RNA-seq, os quais encontram-se disponíveis no NCBI. No presente estudo, esses dados foram utilizados em novas análises a fim de se obter novos recursos genéticos e genômicos em A. angustifolia. No primeiro capítulo, o transcriptoma do Pinheiro do paraná foi analisado com foco na identificação de miRNAs. Este é o primeiro estudo baseado na identificação e análise de pequenos RNAs em uma espécie da família Araucariaceae. A busca por miRNAs conservados no Pinheiro do paraná resultou na identificação de 115 sequencias representativas de 30 famílias. Um total de 106 precursores de miRNAs foram preditos, dos quais, 41 correspondem a miRNAs conservados de 16 diferentes famílias, e 65 foram anotados como novos miRNAs. A comparação das sequencias de pre-miRNAs do pinheiro do paraná com bibliotecas de pequenos RNAs de outras cinco espécies de gimnospermas indicou que 9 dos 65 novos miRNAs são conservados em gimnospermas, enquanto que 56 possivelmente são específicos do Pinheiro do paraná, do gênero Araucaria, ou da família Araucariaceae. Em outra análise comparativa, onde as sequências dos novos pre-miRNAs do Pinheiro do paraná foram alinhadas com unigenes do transcriptoma de A. cunninghamii, sete ortólogos foram identificados nessa espécie congenérica da Oceania. Uma série de miRNAs identificados por análises computacionais de predição foi validada experimentalmente através da técnica de stem-loop RT-qPCR. Nessa análise, os padrões de expressão de miRNAs novos e conservados foram analisados em cinco tecidos distintos coletados de plantas com 90 dias de crescimento. No segundo capítulo, os dados públicos de RNA-seq foram usados para determinar a sequência completa do genoma de cloroplasto (cpDNA) de A. angustifolia. O cpDNA do Pinheiro do paraná tem 146.203 pares de bases de comprimento, e abriga 122 genes, dos quais, 80 codificam 9 polipeptídios, 5 codificam RNAs ribossômicos e 37 codificam RNAs de transferência. As regiões codificantes totalizam 45,02%, sendo que 4,96% equivalem a rRNAs e tRNAs. Os genes normalmente localizados nas repetições invertidas (IRs) estão presentes em cópias únicas, com exceção dos genes rrn5 e tRNA-CAU. A estrutura típica encontrada no cpDNA de vários grupos de plantas terrestres, LSC/IR/SSC/IR, não está presente no plastoma de A. angustifolia. Análises filogenéticas baseadas no método Bayesiano e Mássima Verossimilhança, com unanimidade e alto suporte estatístico, agruparam A. angustifolia com as espécies congenéricas A. heterophylla e A. columnaris. Análises computacionais de predição de microssatélites indicaram que o cpDNA de A. angustifolia apresenta 100 SSRs, dos quais 14 correspondem a loci de tetranucleotídeos. O presente estudo apresenta aspectos importantes em relação à composição, evolução e diversidade de miRNAs de A. angustifolia, uma espécie da família Araucariaceae criticamente ameaçada de extinção. Além de novos recursos genéticos resultantes da identificação de miRNAs, o presente trabalho também apresenta novos recursos genômicos em A. angustifolia, com a montagem e anotação do genoma de cloroplasto. O cpDNA de A. angustifolia apresenta importantes características que podem ser exploradas em diferentes aspectos, como estudos de diversidade populacional, estudos filogenéticos, entre outros.Araucaria angustifolia, commonly known as Brazilian pine, is the only conifer in Brazil with economic importance and was the most important wood species from south Brazil in the past century. Representing valuable source of high-quality wood, Brazilian pine was the target of extensive exploitation activities over decades, suffering massive population decrease. Currently, this conifer is classified as critically endangered species. Brazilian pine has been targeted by some genetic studies mainly with a focus on somatic embryogenesis. Recently, an RNA-seq data were used to perform a transcriptome comparative profile analysis of early development stages, and the sequences are available at NCBI repository. Once a high-throughput sequencing data is released, it can be used in a plethora of ways beyond the original purpose, and more information can be explored in the target organism. In the present study, public RNA-seq data in combination with bioinformatic and experimental analysis were used to identify novel genetic and genomic resources in A. angustifolia. In chapter one, Brazilian pine has its transcriptome explored in respect to microRNAs, representing the first sRNA description in a member of the Araucariaceae family. The screening for conserved miRNAs in Brazilian pine revealed 115 sequences of 30 miRNA families. A total of 106 precursors sequences were predicted. 41 comprised conserved miRNAs from 16 families, whereas 65 were annotated as novel miRNAs. The comparison of Brazilian pine precursors with sRNA libraries of other five conifer species indicates that 9 out 65 novel miRNAs are conserved among gymnosperms, while 56 seem to be specific for Brazilian pine or restricted to Araucariaceae family. Another analysis comparing novel Brazilian pine miRNAs precursors and Araucaria cunninghamii RNA-seq data identified seven orthologs between both species. Mature miRNA identified by bioinformatic predictions were validated using stem-loop RT-qPCR assays. The expression pattern of conserved and novel miRNAs was analyzed in five different tissues of threemonth- old Araucaria seedlings. In chapter two, RNA-Seq data was used to determine the complete nucleotide sequence of the A. angustifolia chloroplast genome (cpDNA). The A. angustifolia cpDNA is 146,203 bp in length and contains 122 genes, including 80 protein-coding genes, 4 ribosomal RNA genes, and 36 tRNA genes. Coding regions comprise 45.02%; 4.96% correspond to rRNAs and tRNAs, and 50.02% of the genome encompasses non-coding regions. Genes found in inverted repeat (IR) are present as 11 single copy, with exceptions to rrn5 and trnI-AUG loci. The typical LSC, SSC, IRa and IRb organization reported in several land-plant groups is not present in A. angustifolia cpDNA. Phylogenetic analyses using Bayesian and Maximum Likelihood methods clustered A. angustifolia in the Araucariaceae family, with A. heterophylla and A. columnaris as congeneric species. The screening of A. angustifolia cpDNA reveled 100 SSRs, 14 of them corresponding to tetrapolymer loci. The present study provides important insights into the nature and composition of miRNAs in a critically endangered species from Araucariaceae, with valuable information on miRNA diversity and conservation in this taxon. Also, the A. angustifolia chloroplast genome assembled in the present study represents the first complete cpDNA genome sequence for this species and shows a set of features that could be further explored for population and phylogenetic studies within this group
    corecore