2 research outputs found

    Hidden Markov model and Chapman Kolmogrov for protein structures prediction from images

    Get PDF
    Protein structure prediction and analysis are more significant for living organs to perfect asses the livingorgan functionalities. Several protein structure prediction methods use neural network (NN). However,the Hidden Markov model is more interpretable and effective for more biological data analysis comparedto the NN. It employs statistical data analysis to enhance the prediction accuracy. The current workproposed a protein prediction approach from protein images based on Hidden Markov Model andChapman Kolmogrov equation. Initially, a preprocessing stage was applied for protein imagesbinarization using Otsu technique in order to convert the protein image into binary matrix. Subsequently,two counting algorithms, namely the Flood fill and Warshall are employed to classify the proteinstructures. Finally, Hidden Markov model and Chapman Kolmogrov equation are applied on the classifiedstructures for predicting the protein structure. The execution time and algorithmic performances aremeasured to evaluate the primary, secondary and tertiary protein structure prediction

    PresCont: Vorhersage von Protein-Protein Interaktionsflächen unter Verwendung struktureller und evolutionärer Eigenschaften

    Get PDF
    Protein-Protein Interaktionen spielen eine essentielle Rolle für jeden lebenden Organismus. Sie sind bei der Aktivierung von Enzymen ebenso wichtig wie für die Signalübertragung und Transportvorgänge. Deswegen sind ca. 80% aller Proteine in größere Komplexe eingebunden. Für ein detailliertes Verständnis eines Protein-Protein Komplexes muss dessen 3D-Struktur bekannt sein. Experimentelle Methoden zur Bestimmung der Protein 3D-Struktur sind jedoch langwierig und aufwändig. Daher ist es sinnvoll, parallel oder alternativ Computerprogramme zu verwenden, um Strukturvorschläge zu generieren. Dazu gehört als wichtiger Teilaspekt die computergestützte Vorhersage von Protein-Protein Kontaktflächen (PPK). In dieser Arbeit wurde die Software PresCont entwickelt, die anhand von 5 Merkmalen, basierend auf der 3D-Struktur des Monomers und evolutionärer Information aus einem Multiplen Sequenzalignment (MSA) homologer Proteinsequenzen, eine Vorhersage der PPK ableitet. Im Gegensatz zu anderen, etablierten Programmen benutzt PresCont lediglich solche Merkmale einer PPK, die einen hohen Beitrag zur Vorhersage leisten und ignoriert Merkmale, die im Vergleich zu anderen Eigenschaften wenig zusätzliche Information liefern. Die fünf, von PresCont verwendeten Merkmale sind Exponiertheit der Aminosäureseitenkette, Häufigkeiten von Aminosäurepaaren, Größe und Vorkommen hydrophober Patches, evolutionäre Konserviertheit und Konnektivität, die als Meta-Eigenschaft mehrere intermolekulare Scores zusammenfasst. Die ersten vier Merkmale wurden bereits häufiger zur Vorhersage von PPKs verwendet, die Eigenschaft Konnektivität wurde bisher nicht benutzt. In PresCont wird durch die Eigenschaft der Konnektivität ein Score für einzelne Positionen aus dem Vorkommen intermolekularer Kontaktpaare abgeleitet. Die Klassifikationsleistung von PresCont konnte zusätzlich gesteigert werden durch die Mittelung der Signale über die lokale Nachbarschaft einzelner Positionen. Nach Normierung wurden die erwähnten Merkmale unter Verwendung einer Support Vektor Maschine (SVM) zu einer aussagekräftigen Vorhersage kombiniert. SVMs haben sich in der Bioinformatik als robuste Klassifikatoren bewährt. Ein wesentlicher Aspekt der Arbeit war es, einen robusten Ansatz zu entwickeln. Daher wurde bewusst die Anzahl der Merkmale beschränkt und es wurden Signale gemittelt, um das Rauschen zu reduzieren. Die Klassifikationsleistung von PresCont wurde mit der von Sppider und ProMate verglichen. Sppider ist ein Vertreter für Klassifikatoren obligater PPKs, ProMate wurde speziell für transiente PPKs entwickelt. Wie zu erwarten, übertrifft die Performanz von Sppider und PresCont gemessen an einem Datensatz obligater Homodimere diejenige von ProMate. Interessanterweise erreicht PresCont mit seinem wesentlich einfacheren Aufbau eine sehr ähnliche Vorhersagequalität wie Sppider. An einem Datensatz transienter Heterodimere hingegen übertrifft die Qualität der Vorhersage von ProMate diejenige von PresCont und Sppider. Es scheint folglich nicht möglich zu sein, einen Klassifikator zu entwickeln, der sowohl für obligate als auch für transiente Komplexe gleich hohe Klassifikationsleistung erreicht. Mit dieser Arbeit wurde belegt, dass die Bewertung von fünf aussagekräftigen Merkmalen ausreicht, um mithilfe einer SVM einen leistungsfähigen Klassifikator zu entwickeln. Dieser steht anderen Verfahren, die ebenfalls den Stand der Technik repräsentieren, aber wesentlich mehr Eigenschaften bewerten und eine komplexere Software-Architektur besitzen, in der Klassifikationsleistung nicht nach
    corecore