38,154 research outputs found

    Accurate De Novo Prediction of Protein Contact Map by Ultra-Deep Learning Model

    Full text link
    Recently exciting progress has been made on protein contact prediction, but the predicted contacts for proteins without many sequence homologs is still of low quality and not very useful for de novo structure prediction. This paper presents a new deep learning method that predicts contacts by integrating both evolutionary coupling (EC) and sequence conservation information through an ultra-deep neural network formed by two deep residual networks. This deep neural network allows us to model very complex sequence-contact relationship as well as long-range inter-contact correlation. Our method greatly outperforms existing contact prediction methods and leads to much more accurate contact-assisted protein folding. Tested on three datasets of 579 proteins, the average top L long-range prediction accuracy obtained our method, the representative EC method CCMpred and the CASP11 winner MetaPSICOV is 0.47, 0.21 and 0.30, respectively; the average top L/10 long-range accuracy of our method, CCMpred and MetaPSICOV is 0.77, 0.47 and 0.59, respectively. Ab initio folding using our predicted contacts as restraints can yield correct folds (i.e., TMscore>0.6) for 203 test proteins, while that using MetaPSICOV- and CCMpred-predicted contacts can do so for only 79 and 62 proteins, respectively. Further, our contact-assisted models have much better quality than template-based models. Using our predicted contacts as restraints, we can (ab initio) fold 208 of the 398 membrane proteins with TMscore>0.5. By contrast, when the training proteins of our method are used as templates, homology modeling can only do so for 10 of them. One interesting finding is that even if we do not train our prediction models with any membrane proteins, our method works very well on membrane protein prediction. Finally, in recent blind CAMEO benchmark our method successfully folded 5 test proteins with a novel fold

    Production and analysis of synthetic Cascade variants

    Get PDF
    CRISPR (clustered regularly interspaced short palindromic repeats)-Cas (CRISPR assoziiert) ist ein adaptives Immunsystem in Archaeen und Bakterien, das fremdes genetisches Material mit Hilfe von Ribonukleoprotein-Komplexen erkennt und zerstört. Diese Komplexe bestehen aus einer CRISPR RNA (crRNA) und Cas Proteinen. CRISPR-Cas Systeme sind in zwei Hauptklassen und mehrere Typen unterteilt, abhängig von den beteiligten Cas Proteinen. In Typ I Systemen sucht ein Komplex namens Cascade (CRISPR associated complex for antiviral defence) nach eingedrungener viraler DNA während einer Folgeinfektion und bindet die zu der eingebauten crRNA komplementäre Sequenz. Anschließend wird die Nuklease/Helikase Cas3 rekrutiert, welche die virale DNA degradiert (Interferenz). Das Typ I System wird in mehrere Subtypen unterteilt, die Unterschiede im Aufbau von Cascade vorweisen. Im Fokus dieser Arbeit steht eine minimale Cascade-Variante aus Shewanella putrefaciens CN-32. Im Vergleich zur gut untersuchten Typ I-E Cascade aus Escherichia coli fehlen in diesem Komplex zwei Untereinheiten, die gewöhnlicher Weise für die Zielerkennung benötigt werden. Dennoch ist der Komplex aktiv. Rekombinante I-Fv Cascade wurde bereits aus E. coli aufgereinigt und es war möglich, den Komplex zu modifizieren, indem das Rückgrat entweder verlängert oder verkürzt wurde. Dadurch wurden synthetische Varianten mit veränderter Protein-Stöchiometrie erzeugt. In der vorliegenden Arbeit wurde I-Fv Cascade weiter mit in vitro Methoden untersucht. So wurde die Bindung von Ziel-DNA beobachtet und die 3D Struktur zeigt, dass strukturelle Veränderungen im Komplex die fehlenden Untereinheiten ersetzen, möglicherweise um viralen Anti-CRISPR Proteinen zu entgehen. Die Nuklease/Helikase dieses Systems, Cas2/3fv, ist eine Fusion des Cas3 Proteins mit dem Interferenz-unabhängigen Protein Cas2. Ein unabhängiges Cas3fv ohne Cas2 Untereinheit wurde aufgereinigt und in vitro Assays zeigten, dass dieses Protein sowohl freie ssDNA als auch Cascadegebundene Substrate degradiert. Das komplette Cas2/3fv Protein bildet einen Komplex mit dem Protein Cas1 und zeigt eine reduzierte Aktivität gegenüber freier ssDNA, möglicherweise als Regulationsmechanismus zur Vermeidung von unspezifischer Aktivität. Weiterhin wurde ein Prozess namens „RNA wrapping“ etabliert. Synthetische Cascade-Komplexe wurden erzeugt, in denen die grundlegende RNA-Bindung des charakteristischen Cas7fv RückgratProteins auf eine ausgewählte RNA gelenkt wird. Diese spezifische Komplexbildung kann in vivo durch eine Repeat-Sequenz der crRNA stromaufwärts der Zielsequenz und durch Bindung des Cas5fv Proteins initiiert werden. Die erzeugten Komplexe beinhalten die ersten 100 nt der markierten RNA, die anschließend isoliert werden kann. Innerhalb der Komplexe ist die RNA stabilisiert und geschützt vor Degradation durch RNasen. Komplexbildung kann außerdem genutzt werden, um ReportergenTranskripte stillzulegen. Zusätzlich wurden erste Hinweise geliefert, dass das Rückgrat der synthetischen Komplexe durch Fusion mit weiteren Reporterproteinen modifiziert werden kann.CRISPR (clustered regularly interspaced short palindromic repeats)-Cas (CRISPR associated) is an adaptive immune system of Archaea and Bacteria. It is able to target and destroy foreign genetic material with ribonucleoprotein complexes consisting of CRISPR RNAs (crRNAs) and certain Cas proteins. CRISPR-Cas systems are classified in two major classes and multiple types, according to the involved Cas proteins. In type I systems, a ribonucleoprotein complex called Cascade (CRISPR associated complex for antiviral defence) scans for invading viral DNA during a recurring infection and binds the sequence complementary to the incorporated crRNA. After target recognition, the nuclease/helicase Cas3 is recruited and subsequently destroys the viral DNA in a step termed interfere nce. Multiple subtypes of type I exist that show differences in the Cascade composition. This work focuses on a minimal Cascade variant found in Shewanella putrefaciens CN-32. In comparison to the well-studied type I-E Cascade from Escherichia coli, this complex is missing two proteins usually required for target recognition, yet it is still able to provide immunity. Recombinant I-Fv Cascade was previously purified from E. coli and it was possible to modulate the complex by extending or shortening the backbone, resulting in synthetic variants with altered protein stoichiometry. In the present study, I-Fv Cascade was further analyzed by in vitro methods. Target binding was observed and the 3D structure revealed structural variations that replace the missing subunits, potentially to evade viral anti-CRISPR proteins. The nuclease/helicase of this system, Cas2/3fv, is a fusion of the Cas3 protein with the interference-unrelated protein Cas2. A standalone Cas3fv was purified without the Cas2 domain and in vitro cleavage assays showed that Cas3fv degrades both free ssDNA as well as Cascade-bound substrates. The complete Cas2/3fv protein forms a complex with the protein Cas1 and was shown to reduce cleave of free ssDNA, potentially as a regulatory mechanism against unspecific cleavage. Furthermore, we established a process termed “RNA wrapping”. Synthetic Cascade assemblies can be created by directing the general RNA-binding ability of the characteristic Cas7fv backbone protein on an RNA of choice such as reporter gene transcripts. Specific complex formation can be initiated in vivo by including a repeat sequence from the crRNA upstream a given target sequence and binding of the Cas5fv protein. The created complexes contain the initial 100 nt of the tagged RNA which can be isolated afterwards. While incorporated in complexes, RNA is stabilized and protected from degradation by RNases. Complex formation can be used to silence reporter gene transcripts. Furthermore, we provided initial indications that the backbone of synthetic complexes can be modified by addition of reporter proteins
    corecore