7 research outputs found

    Graph algorithms for NMR resonance assignment and cross-link experiment planning

    Get PDF
    The study of three-dimensional protein structures produces insights into protein function at the molecular level. Graphs provide a natural representation of protein structures and associated experimental data, and enable the development of graph algorithms to analyze the structures and data. This thesis develops such graph representations and algorithms for two novel applications: structure-based NMR resonance assignment and disulfide cross-link experiment planning for protein fold determination. The first application seeks to identify correspondences between spectral peaks in NMR data and backbone atoms in a structure (from x-ray crystallography or homology modeling), by computing correspondences between a contact graph representing the structure and an analogous but very noisy and ambiguous graph representing the data. The assignment then supports further NMR studies of protein dynamics and protein-ligand interactions. A hierarchical grow-and-match algorithm was developed for smaller assignment problems, ensuring completeness of assignment, while a random graph approach was developed for larger problems, provably determining unique matches in polynomial time with high probability. Test results show that our algorithms are robust to typical levels of structural variation, noise, and missings, and achieve very good overall assignment accuracy. The second application aims to rapidly determine the overall organization of secondary structure elements of a target protein by probing it with a set of planned disulfide cross-links. A set of informative pairs of secondary structure elements is selected from graphs representing topologies of predicted structure models. For each pair in this ``fingerprint\u27\u27, a set of informative disulfide probes is selected from graphs representing residue proximity in the models. Information-theoretic planning algorithms were developed to maximize information gain while minimizing experimental complexity, and Bayes error plan assessment frameworks were developed to characterize the probability of making correct decisions given experimental data. Evaluation of the approach on a number of structure prediction case studies shows that the optimized plans have low risk of error while testing only a very small portion of the quadratic number of possible cross-link candidates

    Automatic assignment of protein backbone resonances by direct spectrum inspection in targeted acquisition of NMR data

    Get PDF
    The necessity to acquire large multidimensional datasets, a basis for assignment of NMR resonances, results in long data acquisition times during which substantial degradation of a protein sample might occur. Here we propose a method applicable for such a protein for automatic assignment of backbone resonances by direct inspection of multidimensional NMR spectra. In order to establish an optimal balance between completeness of resonance assignment and losses of cross-peaks due to dynamic processes/degradation of protein, assignment of backbone resonances is set as a stirring criterion for dynamically controlled targeted nonlinear NMR data acquisition. The result is demonstrated with the 12kDa 13C,15N-labeled apo-form of heme chaperone protein CcmE, where hydrolytic cleavage of 29 C-terminal amino acids is detected. For this protein, 90 and 98% of manually assignable resonances are automatically assigned within 10 and 40h of nonlinear sampling of five 3D NMR spectra, respectively, instead of 600h needed to complete the full time domain grid. In addition, resonances stemming from degradation products are identified. This study indicates that automatic resonance assignment might serve as a guiding criterion for optimal run-time allocation of NMR resources in applications to proteins prone to degradatio

    Automatische sequentielle Zuordnung von mehrdimensionalen Protein-NMR-Spektren sowie molekulardynamisch gestützte stereospezifische Zuordnung von Seitenkettenamidgruppen in Modellpeptiden

    Get PDF
    Im ersten Teil dieser Arbeit wurden die stereospezifischen Zuordnungen der Seitenkettenamidgruppen der Random-Coil-Modellpeptide Gly-Gly-Asn-Ala-NH2 und Gly-Gly-Gln-Ala-NH2 ermittelt. Stereospezifische Zuordnungen werden meistens mit Hilfe von Datenbanken bereits gelöster Biomoleküle bestimmt. Die bekannteste dieser Datenbanken ist die Biological Magnetic Resonance Data Bank (BMRB). Untersucht man die in der BMRB gespeicherten chemischen Verschiebungen genauer, so findet man Inkonsistenzen bei den stereospezifischen Zuordnungen. Es wurde außerdem festgestellt, dass die beiden Programme SHIFTS und SHIFTX, die chemischen Verschiebungen aus den 3D-Strukturen von Peptiden und Proteinen vorhersagen können, Resonanzen ebenfalls stereospezifisch falsch zuordnen können. Für die stereospezifische Zuordnung wurden NOESY-Spektren der Random-Coil-Peptide von Gly-Gly-Asn-Ala-NH2 und Gly-Gly-Gln-Ala-NH2 aufgenommen. Mit AUREMOL RELAX, das den vollständigen Relaxationsmatrixformalismus verwendet, wurden entsprechende Spektren aus Molekulardynamik (MD) Rechnungen der beiden Tetrapeptide simuliert. Ein Vergleich der experimentellen und simulierten Signalvolumina erbrachte eine eindeutige stereospezifische Zuordnung der Random-Coil-Verschiebungen der Seitenkettenamid- und Hβ-Protonen der beiden Aminosäuren. Die vorgestellte Methode hat das Potential in zukünftigen Arbeiten auf einen großen Teil aller Aminosäuren übertragen zu werden, um eine vollständige stereospezifische Random-Coil-Verschiebungsdatenbank zu erzeugen. Im zweiten Teil der Arbeit wurde SIBASA, das neue AUREMOL Modul zur automatischen Zuordnung von HSQC-Spektren und NMR-Protonenresonanzen vorgestellt. SIBASA basiert auf dem Top-Down-Ansatz und bestimmt die vollständige Zuordnung eines Proteins, indem es die optimale Übereinstimmung zwischen experimentellen und mit variablen chemischen Verschiebungen zurückgerechnete NOESY-Spektren findet. Durch den Top-Down-Ansatz ist es möglich 2-D-NOESY-Spektren von großen Proteinen als Informationsquelle der automatische Zuordnung zu verwenden. SIBASA benötigt für die vollständige Zuordnung der Protonen und Stickstoffresonanzen eine 3D-Struktur des Proteins, das 2-D-NOESY- und das 3D 15N-NOESY-HSQC-Spektrum. Die Rückrechnungen der NOESY-Spektren werden wieder mit AUREMOL RELAX erzeugt. RELAX wertet zudem MD-Trajektorien aus, um Informationen über lokale Beweglichkeit im Protein erhalten. Mithilfe der Programme SHIFTS und SHIFTX2 kann SIBASA Wahrscheinlichkeitsdichteverteilungen der chemischen Verschiebungen der zuzuordnen Kerne aus der MD-Trajektorie des betrachten Proteins vorhersagen, was zur Verbesserung der Zuverlässigkeit und Geschwindigkeit der automatischen Zuordnung führt. Die optimale Übereinstimmung der experimentellen und der zurückgerechneten NOESY-Spektren wird durch den Threshold-Accepting-Algorithmus, der in mehreren Instanzen mit verschiedenen Startzuordnung ausgeführt wird, bestimmt. Mehrere Instanzen helfen SIBASA die wahrscheinlichste vollständige Zuordnung zu finden und sind Voraussetzung für die Verifikation. SIBASA ist in der Lage, jeder automatisch gefundene Zuordnung eine Wahrscheinlichkeit zuzuordnen. Die automatische Zuordnung wurde mit den NOESY-Spektren und den Röntgenstrukturen der Proteine von S. aureus HPr (H15A) (88 Aminosäuren), von Thioredoxin Plasmodium falciparum (PfTrx) (104 Aminosäuren) und von Ras(T35S)-GppNHp (166 Aminosäuren) getestet. SIBASA konnte 91,3 % der Resonanzen von HPr (H15A), 81,9 % der Resonanzen von PfTrx und 77,6 % der Resonanzen von Ras(T35S)-GppNHp richtig zuordnen. Eine Verifikation auf dem signifikanten Niveau ermöglicht es, einen großen Teil der falschen Zuordnungen von den richtigen zu trennen. Insgesamt erhielten 77,8 % der automatisch gefunden Resonanzzuordnungen von HPr (H15A), 77,5 % der gefunden Resonanzzuordnungen von PfTrx und 66,8 % der Resonanzzuordnungen von Ras(T35S)-GppNHp von SIBASA eine Wahrscheinlichkeit von mindestens 95 %. Von diesen Resonanzen sind beim HPr (H15A) nur 3,5 %, beim PfTrx nur 9,7 % und beim Ras(T35S)-GppNHp nur 10,2 % falsch zugeordnet worden. Es wurde anhand der drei Proteine gezeigt, dass SIBASA in der Lage ist HSQC-Spektren sicher teilzuordnen. Das HSQC-Spektrum von HPr (H15A) konnte von SIBASA vollständig richtig zugeordnet werden. Beim PfTrx waren 90 % und beim Ras(T35S)-GppNHp 88 % der automatisch gefundenen HSQC-Zuordnungen richtig. Vertraut man nur Zuordnungen von HSQC-Signalen, die von SIBASA bestätigt wurden, so konnten 82 % der Signale von HPr (H15A), 72 % der Signale von PfTrx und 68 % der HSQC-Signale des Ras(T35S)-GppNHp richtig zugeordnet werden. In keinem Fall enthielt die Gruppe der bestätigten Signale eine falsche Zuordnung. Das vorgestellte Modul ermöglicht es für die Wirkstoffentwicklung wichtige [1H,15N]-HSQC-Spektren automatisch zuzuordnen, ohne auf die umständliche Markierung der Proteine mit dem Isotop 13C zurückgreifen zu müssen, wobei eine Kristall- oder eine NMR-Struktur eines homologen Proteins verfügbar ist

    New Approaches to Protein NMR Automation

    Get PDF
    The three-dimensional structure of a protein molecule is the key to understanding its biological and physiological properties. A major problem in bioinformatics is to efficiently determine the three-dimensional structures of query proteins. Protein NMR structure de- termination is one of the main experimental methods and is comprised of: (i) protein sample production and isotope labelling, (ii) collecting NMR spectra, and (iii) analysis of the spectra to produce the protein structure. In protein NMR, the three-dimensional struc- ture is determined by exploiting a set of distance restraints between spatially proximate atoms. Currently, no practical automated protein NMR method exists that is without human intervention. We first propose a complete automated protein NMR pipeline, which can efficiently be used to determine the structures of moderate sized proteins. Second, we propose a novel and efficient semidefinite programming-based (SDP) protein structure determination method. The proposed automated protein NMR pipeline consists of three modules: (i) an automated peak picking method, called PICKY, (ii) a backbone chemical shift assign- ment method, called IPASS, and (iii) a protein structure determination method, called FALCON-NMR. When tested on four real protein data sets, this pipeline can produce structures with reasonable accuracies, starting from NMR spectra. This general method can be applied to other macromolecule structure determination methods. For example, a promising application is RNA NMR-assisted secondary structure determination. In the second part of this thesis, due to the shortcomings of FALCON-NMR, we propose a novel SDP-based protein structure determination method from NMR data, called SPROS. Most of the existing prominent protein NMR structure determination methods are based on molecular dynamics coupled with a simulated annealing schedule. In these methods, an objective function representing the error between observed and given distance restraints is minimized; these objective functions are highly non-convex and difficult to optimize. Euclidean distance geometry methods based on SDP provide a natural formulation for realizing a three-dimensional structure from a set of given distance constraints. However, the complexity of the SDP solvers increases cubically with the input matrix size, i.e., the number of atoms in the protein, and the number of constraints. In fact, the complexity of SDP solvers is a major obstacle in their applicability to the protein NMR problem. To overcome these limitations, the SPROS method models the protein molecule as a set of intersecting two- and three-dimensional cliques. We adapt and extend a technique called semidefinite facial reduction for the SDP matrix size reduction, which makes the SDP problem size approximately one quarter of the original problem. The reduced problem is solved nearly one hundred times faster and is more robust against numerical problems. Reasonably accurate results were obtained when SPROS was applied to a set of 20 real protein data sets

    NMR-spektroskopische Untersuchungen an der Xylanase aus Bacillus agaradhaerens

    Get PDF
    Ziel dieser Arbeit war es, mit den Methoden der NMR-Spektroskopie die elektrostatischen Eigenschaften der Xylanase aus Bacillus agaradhaerens in Abhängigkeit vom pH-Wert zu charakterisieren. Für die vorliegende Arbeit wurde das Strukturgen der Xylanase in verschiedene Expressionsvektoren des pET-Systems kloniert, wobei das Enzym auf 207 Aminosäuren verkürzt wurde. Diese Länge entspricht der publizierten Kristallstrukur von Sabini et al. (1999). Die Expression in pET3a und die Aufreinigung des Genproduktes mit Ionenaustauschchromatographie wurde optimiert, sodass homogenes Protein mit guten Ausbeuten erhalten werden konnte. Die Xylanase wurde mit den Isotopen 15N und 13C markiert und heteronukleare, mehrdimensionale NMR-Spektren wurden für die Zuordnung der Resonanzen des Proteins aufgenommen. Die chemischen Verschiebungswerte des Proteinrückgrats und die der aliphatischen Seitenketten wurden vollständig zugeordnet. Als eine weitere Voraussetzung für eine pH-Titration wurden sequenzspezifisch die Resonanzen der Histidin- bzw. Carboxylatgruppen bestimmt. Die Lösungsstruktur der Xylanase wurde anhand mehrerer automatisierter Prozeduren errechnet, um die Zuordnung der Resonanzen zu validieren. Alle Strukturelemente, die bereits aus der Kristallstruktur bekannt sind, wurden korrekt wiedergegeben. Da die Lösungsstruktur mit einem backbone RMSD-Wert von 2.44 ± 0.29 Å hoch 2 als vorläufig zu betrachten war, wurde im Folgenden ausschließlich die Kristallstruktur zur Bewertung der Distanzbeziehungen verwendet. In Abwesenheit des Substrats wurden die pH-abhängigen Resonanzen der Histidin- und Carboxylatgruppen sowie der Amide des Proteinrückgrats gemessen. Die Auswertung ergab 220 Titrationsprofile der 15N- and 13C-Resonanzen in einem pH-Bereich von 3.2 bis 8.7. Durch nichtlineare Regression der gemessenen Werte an eine modifizierte Henderson-Hasselbalch Gleichung wurden die pK S-Werte der Seitenketten von Aspartat und Glutamat, sowie für das C-terminale Carboxylat und für die Histidingruppen bestimmt. Die Titrationskurven der katalytischen Dyade zeigten eine ausgeprägte gegenseitige Wechselwirkung. Die korrespondierenden pK S-Werte stimmen gut mit dem vorhergesagten enzymatischen Mechanismus überein (Sabini et al., 1999) und belegen, dass das Nukleophil Glu94 bei einem neutralem pH-Wert deprotoniert ist, während die Bronsted Säure/Base GIu184 zu ca. 30% protoniert ist. Um die Untersuchungen zur katalytischen Aktivität zu vervollständigen, wurden alle pH-abhängigen [15N]-Resonanzen der Amide des Proteinrückgrats wie auch die der lndolstickstoffe in der Substratbindungsspalte analysiert. Die Wendepunkte konnten dem Titrationsverhalten der benachbarten sauren Aminosäure-Seitenketten zugeordnet werden. Aber es erscheint sehr wahrscheinlich, dass ein wesentlich komplexerer Ablauf stattfindet. Die asymmetrische Wechselwirkung von Trptophan-Seitenketten bezüglich der katalytischen Dyade wie auch das wechselnde Monotonieverhalten der Titrationskurven deuten auf eine simultane Reorganisation der Seitenkettenkonformere bei pH ungefähr gleich 6 und/oder auf eine Änderung des Wasserstoffbrückennetzwerkes innerhalb der Bindungsspalte

    Cell lysis and activation of trialysin, cytolic protein from Triatoma infestans saliva

    Get PDF
    A saliva de artrópodos hematófagos constitui um coquetel farmacológico que atua nos sistemas hemostático, inflamatório e imunológico de seus hospedeiros para auxiliar a aquisição do sangue. O inseto T. infestans, vetor da doença de Chagas, apresenta em sua saliva uma série de moléculas e atividades biológicas já descritas. Dentre elas está a trialisina, uma proteína formadora de poros em bicamadas lipídicas. A trialisina é capaz de lisar/permeabilizar diversos tipos celulares e se propõe que a atividade lítica ocorra pela inserção da porção N-terminal da molécula na membrana das células de tal forma a promover a formação de um poro. A identificação do gene que codifica a trialisina mostrou que além de ter uma seqüência sinal de secreção, a proteína conteria uma região ácida no seu N-terminal. Este domínio está ausente na proteína madura purificada da saliva e poderia inibir a ação da trialisina. O objetivo de nosso trabalho foi estudar o mecanismo de lise da trialisina e como se daria a ativação do precursor da trialisina (pró-trialisina) durante a secreção da glândula salivar até a ejeção da saliva. Para entender o mecanismo de ação da trialisina, já que a expressão heteróloga tanto da pró-trialisina quanto da trialisina apresentou várias dificuldades, utilizamos peptídeos sintéticos baseados na região N-terminal da trialisina madura. Os peptídeos mostraram diferentes especificidades para tripomastigotas de Trypanosoma cruzi, hemácias humanas e Escherichia coli, mas de modo geral, aqueles que continham a maior parte da primeira hélice anfipática predita na trialisina madura apresentaram maior atividade lítica. Todos os peptídeos adquiriam estrutura secundária (α-hélices) na presença de agentes miméticos de membranas. Determinamos as estruturas tridimensionais em solução por Ressonância Magnética Nuclear dos três peptídeos mais ativos e de um pouco ativo e pudemos observar a importância de segmentos distintos de alguns peptídeos nas especificidades dos alvos. 3 Utilizando um anti-soro gerado contra a porção C-terminal da trialisina recombinante (fragmento não-lítico), identificamos a pró-trialisina em extratos de glândulas salivares contendo APMSF, inibidor da ativação da trialisina. O precursor apresentou menor atividade lítica contra tripomastigotas. Embora fosse previsto que o precursor teria uma porção pró de 33 resíduos, a diferença entre as bandas em SDS-PAGE da pró-trialisina e trialisina foi de cerca de 10-15 aminoácidos. Um peptídeo de fluorescência apagada contendo 12 resíduos da porção pró e 27 do N-terminal da trialisina madura foi sintetizado e observamos que sua atividade lítica era aumentada quando a serino-protease salivar triapsina ou endoproteinase Arg-C eram adicionadas, ao mesmo tempo em que o peptídeo alterava sua estrutura, indicando que a porção acídica é responsável pela inibição da lise. Esses resultados permitiram caracterizar o papel do N-terminal da trialisina no processo de lise, identificar o precursor da trialisina na glândula salivar, verificar sua ativação durante a salivação e melhor elaborar um mecanismo pelo qual a atividade é controlada durante o armazenamento da proteína nas glândulas salivares.Hematophagous arthropods contain in their saliva a pharmacological cocktail that acts on the hemostatic, inflammatory and immune systems of their hosts facilitating blood acquisition. The saliva of the insect T. infestans, vector of Chagas' disease, contains several described molecules and biological activities, among which lies trialysin, a protein that forms pores in lipid bilayers. Trialysin can lyse/permeabilize different cell types and it is proposed that lytic activity is achieved by insertion of the N-terminal portion of the molecule onto a cell membrane forming a pore. The identification of the gene that codes for trialysin has shown that besides a secretion signal sequence, the protein contains an acidic region upstream the mature sequence that is not present in the N-terminus of trialysin purified from saliva and could inhibit the activity of the molecule. Our goal was to study trialysin lytic mechanism and the activation of its precursor (pro-trialysin) from secretion inside the salivary glands to saliva ejection. To understand trialysin action mechanism, since heterologous expression of either protrialysin or trialysin was mostly unsuccessful, we used synthetic peptides based on the Nterminal region of mature trialysin that presented different specificities against T. cruzi trypomastigotes, human erythrocytes and E. coli, but those that encompassed most of the first predicted amphipathic helix in trialysin were more active. All peptides folded into α-helices in the presence of membrane mimetic agents. We solved the tridimensional solution structures by Nuclear Magnetic Resonance of the three most active peptides and a less lytic one and observed that distinct regions of some peptides determine target specificity. Using an anti-serum against the recombinant C-terminal portion of trialysin (non-lytic fragment), we identified pro-trialysin in salivary glands extracts containing APMSF, inhibitor of trialysin activation. The lytic activity of the precursor against trypomastigotes is reduced. 5 Although it was predicted that the precursor would contain a pro-region 33-amino acids long, the difference between the SDS-PAGE trialysin and pro-trialysin bands was around 10-15 residues. Using a fluorescence resonance emission transfer peptide encompassing 12 proregion amino acids and 27 mature N-terminal residues, after incubation with triapsin or endoproteinase Arg-C, an increase in lytic activity was observed. At the same time, the peptide changed its structure indicating this region can impair lysis inside salivary glands. These results allowed us to characterize the role of trialysin N-terminus in the lysis process, identify the trialysin precursor in the salivary gland, and determine the mechanism of activation and lysis control during storage and saliva release.Fundação de Amparo à Pesquisa do Estado de São Paulo (FAPESP)BV UNIFESP: Teses e dissertaçõe
    corecore