105 research outputs found

    A Semi-Quantitative, Synteny-Based Method to Improve Functional Predictions for Hypothetical and Poorly Annotated Bacterial and Archaeal Genes

    Get PDF
    During microbial evolution, genome rearrangement increases with increasing sequence divergence. If the relationship between synteny and sequence divergence can be modeled, gene clusters in genomes of distantly related organisms exhibiting anomalous synteny can be identified and used to infer functional conservation. We applied the phylogenetic pairwise comparison method to establish and model a strong correlation between synteny and sequence divergence in all 634 available Archaeal and Bacterial genomes from the NCBI database and four newly assembled genomes of uncultivated Archaea from an acid mine drainage (AMD) community. In parallel, we established and modeled the trend between synteny and functional relatedness in the 118 genomes available in the STRING database. By combining these models, we developed a gene functional annotation method that weights evolutionary distance to estimate the probability of functional associations of syntenous proteins between genome pairs. The method was applied to the hypothetical proteins and poorly annotated genes in newly assembled acid mine drainage Archaeal genomes to add or improve gene annotations. This is the first method to assign possible functions to poorly annotated genes through quantification of the probability of gene functional relationships based on synteny at a significant evolutionary distance, and has the potential for broad application

    Comparative genomics in acid mine drainage biofilm communities reveals metabolic and structural differentiation of co-occurring archaea

    Get PDF
    Background Metal sulfide mineral dissolution during bioleaching and acid mine drainage (AMD) formation creates an environment that is inhospitable to most life. Despite dominance by a small number of bacteria, AMD microbial biofilm communities contain a notable variety of coexisting and closely related Euryarchaea, most of which have defied cultivation efforts. For this reason, we used metagenomics to analyze variation in gene content that may contribute to niche differentiation among co-occurring AMD archaea. Our analyses targeted members of the Thermoplasmatales and related archaea. These results greatly expand genomic information available for this archaeal order. Results We reconstructed near-complete genomes for uncultivated, relatively low abundance organisms A-, E-, and Gplasma, members of Thermoplasmatales order, and for a novel organism, Iplasma. Genomic analyses of these organisms, as well as Ferroplasma type I and II, reveal that all are facultative aerobic heterotrophs with the ability to use many of the same carbon substrates, including methanol. Most of the genomes share genes for toxic metal resistance and surface-layer production. Only Aplasma and Eplasma have a full suite of flagellar genes whereas all but the Ferroplasma spp. have genes for pili production. Cryogenic-electron microscopy (cryo-EM) and tomography (cryo-ET) strengthen these metagenomics-based ultrastructural predictions. Notably, only Aplasma, Gplasma and the Ferroplasma spp. have predicted iron oxidation genes and Eplasma and Iplasma lack most genes for cobalamin, valine, (iso)leucine and histidine synthesis. Conclusion The Thermoplasmatales AMD archaea share a large number of metabolic capabilities. All of the uncultivated organisms studied here (A-, E-, G-, and Iplasma) are metabolically very similar to characterized Ferroplasma spp., differentiating themselves mainly in their genetic capabilities for biosynthesis, motility, and possibly iron oxidation. These results indicate that subtle, but important genomic differences, coupled with unknown differences in gene expression, distinguish these organisms enough to allow for co-existence. Overall this study reveals shared features of organisms from the Thermoplasmatales lineage and provides new insights into the functioning of AMD communities.United States. Dept. of Energy. Genomics:GTL (Grant DE-FG02-05ER64134)National Science Foundation (U.S.). Graduate Research Fellowshi

    Streamlining and Core Genome Conservation among Highly Divergent Members of the SAR11 Clade

    Get PDF
    SAR11 is an ancient and diverse clade of heterotrophic bacteria that are abundant throughout the world’s oceans, where they play a major role in the ocean carbon cycle. Correlations between the phylogenetic branching order and spatiotemporal patterns in cell distributions from planktonic ocean environments indicate that SAR11 has evolved into perhaps a dozen or more specialized ecotypes that span evolutionary distances equivalent to a bacterial order. We isolated and sequenced genomes from diverse SAR11 cultures that represent three major lineages and encompass the full breadth of the clade. The new data expand observations about genome evolution and gene content that previously had been restricted to the SAR11 Ia subclade, providing a much broader perspective on the clade’s origins, evolution, and ecology. We found small genomes throughout the clade and a very high proportion of core genome genes (48 to 56%), indicating that small genome size is probably an ancestral characteristic. In their level of core genome conservation, the members of SAR11 are outliers, the most conserved free-living bacteria known. Shared features of the clade include low GC content, high gene synteny, a large hypervariable region bounded by rRNA genes, and low numbers of paralogs. Variation among the genomes included genes for phosphorus metabolism, glycolysis, and C1 metabolism, suggesting that adaptive specialization in nutrient resource utilization is important to niche partitioning and ecotype divergence within the clade. These data provide support for the conclusion that streamlining selection for efficient cell replication in the planktonic habitat has occurred throughout the evolution and diversification of this clade

    Single-cell enabled comparative genomics of a deep ocean SAR11 bathytype.

    Get PDF
    This is the author's accepted mansucript.Final version available from Nature via the DOI in this record.Bacterioplankton of the SAR11 clade are the most abundant microorganisms in marine systems, usually representing 25% or more of the total bacterial cells in seawater worldwide. SAR11 is divided into subclades with distinct spatiotemporal distributions (ecotypes), some of which appear to be specific to deep water. Here we examine the genomic basis for deep ocean distribution of one SAR11 bathytype (depth-specific ecotype), subclade Ic. Four single-cell Ic genomes, with estimated completeness of 55%-86%, were isolated from 770 m at station ALOHA and compared with eight SAR11 surface genomes and metagenomic datasets. Subclade Ic genomes dominated metagenomic fragment recruitment below the euphotic zone. They had similar COG distributions, high local synteny and shared a large number (69%) of orthologous clusters with SAR11 surface genomes, yet were distinct at the 16S rRNA gene and amino-acid level, and formed a separate, monophyletic group in phylogenetic trees. Subclade Ic genomes were enriched in genes associated with membrane/cell wall/envelope biosynthesis and showed evidence of unique phage defenses. The majority of subclade Ic-specfic genes were hypothetical, and some were highly abundant in deep ocean metagenomic data, potentially masking mechanisms for niche differentiation. However, the evidence suggests these organisms have a similar metabolism to their surface counterparts, and that subclade Ic adaptations to the deep ocean do not involve large variations in gene content, but rather more subtle differences previously observed deep ocean genomic data, like preferential amino-acid substitutions, larger coding regions among SAR11 clade orthologs, larger intergenic regions and larger estimated average genome size.This work was supported by the Gordon and Betty Moore Foundation (SJG and EFD), the US Department of Energy Joint Genome Institute (JGI) Community Supported Program grant 2011-387 (RS, BKS, EFD, SJG), National Science Foundation (NSF) Science and Technology Center Award EF0424599 (EFD), NSF awards EF-826924 (RS), OCE-821374 (RS) and OCE-1232982 (RS and BKS), and is based on work supported by the NSF under Award no. DBI-1003269 (JCT). Sequencing was conducted by JGI and supported by the Office of Science of the US Department of Energy under Contract No. DE-AC02-05CH11231

    Genetics of Halophilic Microorganisms

    Get PDF
    Halophilic microorganisms are found in all domains of life and thrive in hypersaline (high salt content) environments. These unusual microbes have been a subject of study for many years due to their interesting properties and physiology. Studies of the genetics of halophilic microorganisms (from gene expression and regulation to genomics) have provided understanding into the mechanisms of how life can exist at high salinity levels. Here, we highlight recent studies that advance the knowledge of biological function through examination of the genetics of halophilic microorganisms and their viruses

    Comparative Genomics of the Genus Methanohalophilus, Including a Newly Isolated Strain From Kebrit Deep in the Red Sea

    Get PDF
    Halophilic methanogens play an important role in the carbon cycle in hypersaline environments, but are under-represented in culture collections. In this study, we describe a novel Methanohalophilus strain that was isolated from the sulfide-rich brine-seawater interface of Kebrit Deep in the Red Sea. Based on physiological and phylogenomic features, strain RSK, which is the first methanogenic archaeon to be isolated from a deep hypersaline anoxic brine lake of the Red Sea, represents a novel species of this genus. In order to compare the genetic traits underpinning the adaptations of this genus in diverse hypersaline environments, we sequenced the genome of strain RSK and compared it with genomes of previously isolated and well characterized species in this genus (Methanohalophilus mahii, Methanohalophilus halophilus, Methanohalophilus portucalensis, and Methanohalophilus euhalobius). These analyses revealed a highly conserved genomic core of greater than 93% of annotated genes (1490 genes) containing pathways for methylotrophic methanogenesis, osmoprotection through salt-out strategy, and oxidative stress response, among others. Despite the high degree of genomic conservation, species-specific differences in sulfur and glycogen metabolisms, viral resistance, amino acid, and peptide uptake machineries were also evident. Thus, while Methanohalophilus species are found in diverse extreme environments, each genotype also possesses adaptive traits that are likely relevant in their respective hypersaline habitats

    Xenology of beta-lactamases: association of its genetic sources and putative pleiotropism

    Get PDF
    Tese de mestrado. Microbiologia Aplicada. Universidade de Lisboa, Faculdade de Ciências, 2013Em bactérias Gram-negativas, a fase final da síntese do peptidoglicano ocorre no lado periplasmático da membrana celular, envolvendo reacções de carboxipeptidação e transpeptidação mediadas por DD-peptidases membranares. Estas enzimas pertencem a uma família de proteínas conhecidas colectivamente como Penicillin-Binding Proteins (PBPs). As PBPs constituem o alvo preferencial dos antibióticos β-lactâmicos. A molécula do β-lactâmico actua como análogo do substrato enzimático, formando um complexo covalente acil-enzima muito estável, uma reacção que é irreversível e que resulta na inactivação da enzima. Consequentemente, dá-se o bloqueio da biossíntese da parede celular, o que pode resultar em lesões, perda de permeabilidade selectiva, e mesmo na lise celular. As bactérias têm a capacidade de detectar interferências no metabolismo da sua parece celular e traduzir o stress resultante em sinais que induzem respostas defensivas. No decurso da sua evolução, as bactérias desenvolveram várias estratégias para lidar com os efeitos prejudiciais dos antibióticos, como os β-lactâmicos. Em Gram-negativas de relevância clínica, o mecanismo mais importante e frequente de resistência aos β-lactâmicos consiste na produção de β-lactamases. Estas enzimas hidrolisam a ligação amida do anel β-lactâmico, destruindo o local de ligação às PBPs bacterianas e inactivando assim o seu efeito antimicrobiano. Algumas β-lactamases requerem a ligação a iões zinco (Zn2+) para romper o anel β -lactâmico, mas a maioria das enzimas são serina-hidrolases. Semelhantemente às PBPs, as serina-enzimas têm um motivo conservado Ser-x-x- Lys, constituindo a serina o resíduo do sítio activo. Apesar de partilharem uma estrutura semelhante ao nível do sítio activo, a ligação da PBP ao substrato β-lactâmico (via resíduo de serina) inactiva a enzima, ao passo que o mesmo substrato é hidrolisado pela β -lactamase, sendo a enzima liberta. As serina-β-lactamases cromossomais podem ter evoluído a partir das PBPs, com quem partilham algumas homologia de sequência, ou apresentarem uma evolução paralela associada a pleiotropia funcional. Neste caso, estas enzimas teriam sido seleccionadas pela função secundária, associada ao consumo de antimicrobianos. Esta hipótese é apoiada pelo facto dos genes que codificam as β-lactamases serem geneticamente conservados, e a sua expressão se encontrar associada a mecanismos fisiológicos responsáveis pelo arranjo da parede celular. A evolução destes genes pode ter sido assim possível devido a pressões selectivas exercidas por organismos produtores de β-lactâmicos presentes no solo, ou pela importância pleiotrópica da sua função primária na fisiologia microbiana. Contudo, o uso clínico actual dos β-lactâmicos ser o principal factor selectivo a influenciar o isolamento de β-lactamases em organismos patogénicos. Actualmente, as β-lactamases são classificadas de acordo com a sua estrutura primária (classificação de Ambler) ou com a sua função (classificação de Bush-Jacoby-Medeiros). A classificação de Ambler divide estas enzimas em quatro classes (A – D), com base em motivos de aminoácidos conservados. As enzimas das classes A, C e D são serina-β-lactamases, enquanto que as enzimas da classe B são conhecidas como Metalo-β-lactamases (MBLs). O esquema de classificação de Bush-Jacoby- Medeiros, por sua vez, baseia-se na similaridade funcional (perfil de substrato e inibição) das enzimas incluídas em cada classe do esquema de classificação de Ambler. Este sistema compreende quatro grupos funcionais principais (1 – 4), com vários subgrupos dentro do grupo 2 (a – f). As enzimas do grupo 1 pertencem à classe C e hidrolisam preferencialmente cefalosporinas, não sendo normalmente inibidas pelo ácido clavulânico ou por tazobactam. Em bactérias Gram-negativas, as cefalosporinases cromossomais mais relevantes constituem o grupo de enzimas conhecidas colectivamente como β-lactamases AmpC (AmpCs). A informação existente sugere uma ligação estreita entre a indução destas enzimas e a reciclagem do peptidoglicano. Neste caso, a hidrólise de β-lactâmicos teria sido uma resposta evolutiva à pressão de selecção efectuada pelas cefalosporinas, de modo a proteger as bactérias da sua acção antimicrobiana. De facto, as AmpC cromossomais são expressas frequentemente como enzimas induzíveis, em resposta à exposição a β-lactâmicos. Estas enzimas não contribuem significativamente para a resistência clínica a estes antibióticos, uma vez que são normalmente expressas a baixos níveis, mas podem causar complicações terapêuticas severas caso os seus genes sejam translocados para plasmídeos. Recentemente, foram identificadas cefalosporinases de espectro hidrolítico alargado, com susceptibilidade reduzida a todo o tipo de cefalosporinas, incluindo as de quarta-geração (ex. cefepima e cefepiroma). Estas AmpCs de amplo espectro (ESACs) encontram-se relacionadas estruturalmente com as AmpC do grupo 1, como resultado de substituições, inserções e delecções de aminoácidos, e encontram-se reunidas no grupo 1e. A disseminação deste tipo de enzimas pode comprometer a utilidade clínica da maioria dos β-lactâmicos. O grupo 2 inclui β-lactamases pertencentes às classes A e D. Estas enzimas têm mais afinidade para o ácido clavulânico do que para o tazobactam. Destacam-se as β-lactamases de espectro alargado (ESBLs) do subgrupo 2be, as quais derivam das enzimas do subgrupo 2b por apenas algumas substituições de aminoácidos. As ESBLs pertencem à classe A e, à semelhança de algumas enzimas do grupo 1, são capazes de hidrolisar cefalosporinas de quarta-geração. Contudo, as ESBL são susceptíveis ao ácido clavulânico e ao tazobactam, contrariamente às cefalosporinases do grupo 1. Nesta dissertação, o termo “ESBL” foi extendido às β-lactamases da classe D que se encontram reunidas no subgrupo 2de. Estas enzimas derivam das oxacilinases (OXAs) do subgrupo 2d e conseguem hidrolisar cefalosporinas de quarta-geração, retendo igualmente a capacidade de hidrolisar cloxacilina (ou oxacilina). As MBLs da classe B encontram-se reunidas no grupo 3, sendo inibidas distintivamente pelo EDTA, mas não pelo ácido clavulânico ou pelo tazobactam. À excepção dos monobactamos (ex. aztreonam), que são hidrolisados pelas serina-enzimas, as metalo-enzimas conseguem hidrolisar todos as classes de β-lactâmicos. As MBLs encontram-se actualmente subdivididas em três subclasses estruturais (B1, B2 e B3), as quais se encontram alinhadas com dois subgrupos funcionais (3a e 3b), com base em similaridades funcionais. As enzimas do subgrupo 3a (subclasses B1 e B3) requerem a ligação de dois iões Zn2+ ao seu sítio activo para o desempenho da sua actividade hidrolítica de amplo espectro. Pelo contrário, as enzimas do subgrupo 3b (subclasse B2) são inibidas se ocorrer a ligação a um segundo ião Zn2+. Estas metalo-enzimas possuem um espectro hidrolítico reduzido, actuando preferencialmente sobre carbapenemos. As primeiras MBLs descritas foram identificadas em bactérias Gram-negativas de origem ambiental, sendo na sua maioria enzimas cromossomais e induzíveis, associadas provavelmente a uma outra função metabólica ainda desconhecida. Estas enzimas apresentam distribuição ubiquitária e são reconhecidas actualmente como o reservatório mais importante destes genes de resistência. No entanto, as bactérias que as produzem são geralmente patogénios oportunistas, não associados frequentemente a infecções nosocomiais graves. De facto, são as metalo-enzimas encontradas em elementos transmissíveis, particularmente em integrões ou plasmídeos, que se encontram disseminadas globalmente em bactérias patogénicas de relevância clínica. Assim sendo, é de extrema importância científica e de Saúde Pública a real compreensão do modelo de evolução destas enzimas, como também a identificação dos reservatórios genéticos e avaliação do seu potencial na emergência de novas enzimas hidrolíticas de β-lactâmicos. O presente estudo teve por objectivo clarificar as relações evolutivas entre as diferentes classes de β-lactamases, e também procurar compreender como elas se tornaram nas enzimas hidrolíticas de β-lactâmicos dos dias de hoje. Para tal, recorreu-se à análise filogenética e funcional de sequências nucleotídicas e aminoacídicas destas enzimas. Inicialmente, foram alinhadas 61 sequências aminoacídicas de β-lactamases de origem cromossomal, as quais foram posteriormente sujeitas a análise filogenética, recorrendo-se ao método da máxima parcimónia (MP). O critério de selecção destas sequências consistiu em reunir enzimas representativas de cada classe molecular de Ambler e grupo funcional de Bush-Jacoby-Medeiros descritos actualmente, de acordo com os respectivos esquemas de classificação. A partir da árvore filogenética inferida, foi possível organizar as sequências de β-lactamases em 8 grupos (ou clusters) (α – θ), os quais revelaram ser consistentes com os agrupamentos de classificação molecular e funcional em vigor para estas enzimas. Enzimas representativas de cada cluster foram então utilizadas para pesquisar proteínas ortólogas nas bases de dados públicas. A filogenia destas sequências foi reconstruída, igualmente, através da abordagem MP. A análise filogenética revelou que a maior parte dos ortólogos putativos surgiu recentemente, juntamente com as β-lactamases com as quais aparentam estar mais relacionados, visto haver pouca divergência em relação ao ancestral comum a partir do qual ocorreu o evento de especiação. Existem também ramos na árvore mais longos, particularmente no grupo das OXAs, os quais representam um grau de divergência mais elevado, resultante de um maior número de substituições de aminoácidos. Estes resultados sugerem que as oxacilinases podem ter surgido na fase inicial da evolução das β-lactamases. Uma vez que a similaridade por homologia nem sempre é sinónimo de funções idênticas, a inferência de homologia pode não ser suficiente para efectuar previsões funcionais rigorosas. Assim sendo, recorreu-se às ferramentas InterProScan e CDD para a anotação funcional das sequências representativas de cada cluster e dos seus ortólogos putativos. Esta análise funcional revelou que todos os ortólogos putativos partilham alguns domínios conservados com a mesma superfamília de β-lactamases com quem aparentam estar relacionados. Estes domínios funcionais encontram-se relacionados com actividade hidrolítica de β-lactâmicos, o que sugere estarmos perante ortologia genuína. As metalo-enzimas da classe B e os seus ortólogos partilham um domínio funcional específico com outras enzimas da mesma superfamília, as glutationa tiolesterases. Estas enzimas hidrolisam S-D-lactoilglutationa em glutationa e D-ácido láctico, requerendo a ligação a dois iões Zn2+ como cofactor. Estes resultados sugerem a existência de uma possível pleiotropia funcional para as metalo-enzimas Por fim, foram estimados os rácios Ka/Ks para os genes codificantes das 61 β-lactamases cromossomais, visto que a identificação de selecção natural positiva poderia evidenciar alterações adaptativas na função. A filogenia destas sequências foi reconstruída, recorrendo-se ao método da máxima verosimilhança (ML). Um total de 8 genes revelou estar sob selecção positiva (Ka/Ks >1), o que pode indicar que as proteínas codificadas podem ter alterado a sua função, possivelmente devido à pressão selectiva dos β-lactâmicos. De facto, os genes que codificam as metalo-enzimas CAU-1 e Mbl1b de C. crescentus parecem enquadrar-se neste cenário, tendo sido sugerido que estas enzimas representam hidrolases ancestrais que foram seleccionadas positivamente em resposta à presença de β-lactâmicos produzidos por fungos no solo. Os resultados obtidos fortalecem esta hipótese, bem como a de pleiotropia funcional nas MBLs, evidenciada pelas previsões funcionais. O facto de se terem detectado genes que codificam para enzimas da família OXA sob selecção positiva, suporta a hipótese destas enzimas poderem ter tido uma função importante na fitness bacteriana, como referido anteriormente. Os genes que codificam as cefalosporinases de P. aeruginosa, PDC-1 e PDC-2, parecem partilhar um ancestral comum com as AmpCs. O facto destes genes aparentarem estar sob forte selecção positiva pode significar que a mutação que conferiu a vantagem selectiva na presença do β-lactâmico e, assim, a alteração na função, pode ter-se fixado no seu DNA. Observou-se um elevado grau de conservação no grupo das AmpCs, sugerido pelos baixos rácios Ka/Ks apresentados, o qual pode indicar que estes genes são essenciais para as bactérias e, como tal, evoluem mais lentamente do que os genes não-essenciais. De facto, foi sugerida a existência de uma relação estreita entre a indução das AmpCs e a reciclagem do peptidoglicano, antes da pressão selectiva imposta pelas cefalosporinas, o que pode significar que estas enzimas têm um papel crucial na fisiologia bacteriana. Apesar de por vezes óbvia, nem sempre é possível demonstrar a existência de pleiotropia funcional. Não obstante, esta propriedade parece desempenhar um papel fundamental na evolução dos genes das β-lactamases. De facto, pensa-se que o efeito pleiotrópico pode aumentar quando as bactérias se deparam com novos desafios selectivos, como é o caso dos antibióticos β-lactâmicos. Dependendo de como o novo caracter fenotípico (função) afecta a fitness bacteriana, os genes tornam-se pleiotrópicos ou especializados numa única função. Os resultados apresentados neste estudo contribuíram para o reconhecimento de um certo grau de pleiotropia funcional nas β-lactamases, e para uma maior compreensão de como estas proteínas podem ter evoluído e se tornado em enzimas específicas, responsáveis pela hidrólise de β-lactâmicos. Estudos adicionais combinando análise da sintenia de genes, alinhamentos estruturais, filogenias de genes individuais, interacções proteínaproteína e análises de recombinação e selecção, poderão ajudar a identificar e clarificar os processos evolutivos destas enzimas.In clinically important Gram-negative bacteria, the predominant mechanism for β-lactam resistance is the synthesis of β-lactamases. These enzymes hydrolyze the amide bond in the β-lactam ring of these antibiotics, inactivating their effect. A few β-lactamases are zinc-dependent hydrolases, or Metallo-β-lactamases, requiring at least one zinc ion for disrupting the β-lactam ring. However, most enzymes are serine hydrolases, operating via a serine-ester mechanism. The chromosomal serine β-lactamases may have evolved from the Penicillin-Binding Proteins, with whom they share sequence homologies, or present parallel evolution associated with functional pleiotropy, resulting from the selective pressures performed by β-lactam-producing organisms in the soil. However, the current clinical misuse of β-lactams seems to be the most important factor for the dissemination of β-lactam resistance among pathogenic bacteria. The present study aimed to clarify the evolutionary relationships between the β-lactamases, and to understand how they became the specific β-lactam-hydrolyzing enzymes nowadays. Phylogenetic and functional analysis from nucleotide and amino acid sequences was used. Phylogenies were reconstructed using Maximum Parsimony. Analysis revealed that most putative orthologs have arisen recently along with some already described β-lactamases, although a higher degree of divergence was evidenced for the oxacillinases, suggesting they may have evolved at the early stages of β-lactamase evolution. Functional predictions revealed that all putative orthologs share conserved domains with the β-lactamase superfamily with whom they seem more closely related. Putative pleiotropism was also evidenced for the metalloenzymes. Finally, Ka/Ks ratios were estimated. Eight β-lactamase genes were found to be under positive selection, suggesting possible adaptive changes in function. Overall, this study has contributed to the acknowledgement of some level of functional pleiotropy within the β-lactamases. Further studies combining analysis of gene synteny, structural alignments, phylogenies of individual genes, protein-protein interactions, and analyses of recombination and selection would help identify and clarify the evolutionary processes of such enzymes

    Persisting Viral Sequences Shape Microbial CRISPR-based Immunity

    Get PDF
    Well-studied innate immune systems exist throughout bacteria and archaea, but a more recently discovered genomic locus may offer prokaryotes surprising immunological adaptability. Mediated by a cassette-like genomic locus termed Clustered Regularly Interspaced Short Palindromic Repeats (CRISPR), the microbial adaptive immune system differs from its eukaryotic immune analogues by incorporating new immunities unidirectionally. CRISPR thus stores genomically recoverable timelines of virus-host coevolution in natural organisms refractory to laboratory cultivation. Here we combined a population genetic mathematical model of CRISPR-virus coevolution with six years of metagenomic sequencing to link the recoverable genomic dynamics of CRISPR loci to the unknown population dynamics of virus and host in natural communities. Metagenomic reconstructions in an acid-mine drainage system document CRISPR loci conserving ancestral immune elements to the base-pair across thousands of microbial generations. This ‘trailer-end conservation’ occurs despite rapid viral mutation and despite rapid prokaryotic genomic deletion. The trailer-ends of many reconstructed CRISPR loci are also largely identical across a population. ‘Trailer-end clonality’ occurs despite predictions of host immunological diversity due to negative frequency dependent selection (kill the winner dynamics). Statistical clustering and model simulations explain this lack of diversity by capturing rapid selective sweeps by highly immune CRISPR lineages. Potentially explaining ‘trailer-end conservation,’ we record the first example of a viral bloom overwhelming a CRISPR system. The polyclonal viruses bloom even though they share sequences previously targeted by host CRISPR loci. Simulations show how increasing random genomic deletions in CRISPR loci purges immunological controls on long-lived viral sequences, allowing polyclonal viruses to bloom and depressing host fitness. Our results thus link documented patterns of genomic conservation in CRISPR loci to an evolutionary advantage against persistent viruses. By maintaining old immunities, selection may be tuning CRISPR-mediated immunity against viruses reemerging from lysogeny or migration
    corecore