7 research outputs found

    Computational Analysis and Prediction of Intrinsic Disorder and Intrinsic Disorder Functions in Proteins

    Get PDF
    COMPUTATIONAL ANALYSIS AND PREDICTION OF INTRINSIC DISORDER AND INTRINSIC DISORDER FUNCTIONS IN PROTEINS By Akila Imesha Katuwawala A dissertation submitted in partial fulfillment of the requirements for the degree of Engineering, Doctor of Philosophy with a concentration in Computer Science at Virginia Commonwealth University. Virginia Commonwealth University, 2021 Director: Lukasz Kurgan, Professor, Department of Computer Science Proteins, as a fundamental class of biomolecules, have been studied from various perspectives over the past two centuries. The traditional notion is that proteins require fixed and stable three-dimensional structures to carry out biological functions. However, there is mounting evidence regarding a “special” class of proteins, named intrinsically disordered proteins, which do not have fixed three-dimensional structures though they perform a number of important biological functions. Computational approaches have been a vital component to study these intrinsically disordered proteins over the past few decades. Prediction of the intrinsic disorder and functions of intrinsic disorder from protein sequences is one such important computational approach that has recently gained attention, particularly in the advent of the development of modern machine learning techniques. This dissertation runs along two basic themes, namely, prediction of the intrinsic disorder and prediction of the intrinsic disorder functions. The work related to the prediction of intrinsic disorder covers a novel approach to evaluate the predictive performance of the current computational disorder predictors. This approach evaluates the intrinsic disorder predictors at the individual protein level compared to the traditional studies that evaluate them over large protein datasets. We address several interesting aspects concerning the differences in the protein-level vs. dataset-level predictive quality, complementarity and predictive performance of the current predictors. Based on the findings from this assessment we have conceptualized, developed, tested and deployed an innovative platform called DISOselect that recommends the most suitable computational disorder predictors for a given protein, with an underlying goal to maximize the predictive performance. DISOselect provides advice on whether a given disorder predictor would provide an accurate prediction for a given protein of user’s interest, and recommends the most suitable disorder predictor together with an estimate of its expected predictive quality. The second theme, prediction of the intrinsic disorder functions, includes first-of-its-kind evaluation of the current computational disorder predictors on two functional sub-classes of the intrinsically disordered proteins. This study introduces several novel evaluation strategies to assess predictive performance of disorder prediction methods and focuses on the evaluation for disorder functions associated with interactions with partner molecules. Results of this analysis motivated us to conceptualize, design, test and deploy a new and accurate machine learning-based predictor of the disordered lipid-binding residues, DisoLipPred. We empirically show that the strong predictive performance of DisoLipPred stems from several innovative design features and that its predictions complements results produced by current disorder predictors, disorder function predictors and predictors of transmembrane regions. We deploy DisoLipPred as a convenient webserver and discuss its predictions on the yeast proteome

    Structural features and functional residues important for the activity of an unusual membrane bound O-acyltransferase

    Get PDF
    Doctor of PhilosophyBiochemistry and Molecular BiophysicsTimothy P. DurrettThe membrane bound O-acyltransferase (MBOAT) family contains multi-pass membrane proteins that add fatty acids to different compounds. Despite their importance in economic activity and human health, little is known about the localization of the active site and regions important for determining substrate specificity of MBOATs. Euonymus alatus diacylglycerol acetyltransferase (EaDAcT) is the only known MBOAT enzyme that exhibits a high preference for acetyl-CoA, the shortest possible acyl-CoA. EaDAcT catalyzes the transfer of the acetate group from acetyl-CoA to the sn-3 position of diacylglycerol to form 3-acetyl-1,2-diacyl-sn-glycerol. Our goal was to investigate the structural features and the amino acid residues that define substrate specificity of EaDAcT to provide insights into the mechanism by which MBOAT family controls substrate selection. By mapping the membrane topology of EaDAcT we obtained the first experimentally determined topology model for a plant MBOAT. The EaDAcT model contains four transmembrane domains with both the N- and C- termini oriented toward the endoplasmic reticulum lumen. The MBOAT signature region including the putative active site His-257 of the protein is embedded in the third transmembrane domain close to the interface between the membrane and the cytoplasm. In order to identify amino acid residues important for acetyltransferase activity, we isolated and characterized orthologs of EaDAcT from other acetyl-TAG producing plants. Among them, the acetyltransferase from Euonymus fortunei possessed the highest activity in vivo and in vitro. Mutagenesis of conserved residues of DAcTs revealed that Ser-253, His-257 and Asp-258 are essential for enzyme activity of EaDAcT, suggesting their involvement in the enzyme catalysis. Alteration of residues unique to acetyltransferases did not alter the acyl donor specificity of EaDAcT, implying that multiple amino acids are important for substrate recognition. Together, this work identifies the structural features of EaDAcT and offers an initial view of the amino acids important for activity of the enzyme

    Υπολογιστικές μελέτες δομής και λειτουργίας μεμβρανικών πρωτεϊνών και του ρόλου τους σε ασθένειες

    Get PDF
    Οι μεμβρανικές πρωτεΐνες είναι μία από τις πιο πολυπληθείς ομάδες κυτταρικών πρωτεϊνών και επιτελούν μια σειρά από πολύ σημαντικές λειτουργίες, μεταξύ των οποίων περιλαμβάνονται η κυτταρική αναγνώριση, η λειτουργία τους ως μοριακών υποδοχέων, η παθητική ή ενεργητική μεταφορά ουσιών διαμέσου της μεμβράνης και η εξειδικευμένη ενζυμική δραστηριότητα. Όπως γίνεται εύκολα αντιληπτό, οποιαδήποτε πιθανή αλλοίωση των μεμβρανικών πρωτεϊνών μπορεί δυνητικά να οδηγήσει σε διαφόρων ειδών ασθένειες. Ως εκ τούτου, οι πρωτεΐνες αυτές είναι δυνατόν να αποτελέσουν και οι ίδιες στόχους φαρμάκων, με σκοπό την αναστολή ή την ενίσχυση της λειτουργίας τους, κατά περίπτωση. Γενικά, οι μεμβρανικές πρωτεΐνες ταξινομούνται, ανάλογα με τον τρόπο αλληλεπίδρασής τους με τη μεμβράνη, σε τρεις μεγάλες ομάδες· α) τις περιφερειακές μεμβρανικές πρωτεΐνες που αλληλεπιδρούν με ασθενείς αλληλεπιδράσεις είτε με τα λιπίδια της μεμβράνης ή με πρωτεΐνες αυτής, β) τις διαμεμβρανικές πρωτεΐνες, οι οποίες διαπερνούν με την πολυπεπτιδική τους αλυσίδα τη λιπιδική διπλοστιβάδα και γ) τις αγκυροβολημένες πρωτεΐνες, οι οποίες αλληλεπιδρούν ομοιοπολικά με λιπίδια της μεμβράνης. Στα πλαίσια της παρούσας διδακτορικής διατριβής πραγματοποιήθηκε:•ανάλυση δομικών και λειτουργικών χαρακτηριστικών των μεμβρανικών πρωτεϊνών, η οποία επέτρεψε •τον σχεδιασμό και την ανάπτυξη υπολογιστικών μεθόδων για την ταυτοποίηση μεμβρανικών πρωτεϊνών σε πρωτεώματα και •την κατασκευή μίας βάσης δεδομένων για τη συλλογή και καταγραφή πληροφοριών για ένα υποσύνολο των μεμβρανικών πρωτεϊνών.Επιπλέον, μελετήθηκαν •οι αλληλεπιδράσεις των μεμβρανικών πρωτεϊνών με άλλα βιομόρια, με στόχο την εξακρίβωση της συμμετοχής τους και του ρόλου τους σε ανθρώπινες ασθένειες.Οι περιφερειακές μεμβρανικές πρωτεΐνες είναι η λιγότερο μελετημένη ομάδα μεμβρανικών πρωτεϊνών, δίχως αυτό το γεγονός να τις καθιστά μη σημαντικές. Οι πρωτεΐνες αυτές αλληλεπιδρούν με την επιφάνεια της μεμβράνης μη ομοιοπολικά και η αλληλεπίδραση αυτή μπορεί να γίνεται τόσο με τα λιπίδια της μεμβράνης (άμεση αλληλεπίδραση), όσο και με πρωτεΐνες της (έμμεση αλληλεπίδραση). Στην άμεση μη ομοιοπολική αλληλεπίδραση με τη μεμβράνη μπορούν να συμμετέχουν ειδικές αυτοτελείς δομικές περιοχές που αλληλεπιδρούν με λιπίδια της μεμβράνης (Membrane Binding Domains – MBDs). Οι περιφερειακές μεμβρανικές πρωτεΐνες βοηθούν στην αλληλεπίδραση με τον κυτταροσκελετό, παρέχοντας στήριξη σε διάφορες μεμβράνες του κυττάρου. Επίσης, παίζουν πολύ σημαντικό ρόλο στην επικοινωνία μεταξύ του εσωτερικού και του εξωτερικού του κυττάρου και πολλές από αυτές τις πρωτεΐνες εντοπίζονται σε χαρακτηριστικές μεμβρανικές δομές, οι οποίες είναι γνωστές ως λιπιδικές σχεδίες, όπου και εμπλέκονται ενεργά στη κυτταρική σηματοδότηση.Στη παρούσα διδακτορική διατριβή αναπτύχθηκε η μέθοδος MBPpred, η οποία έχει τη δυνατότητα να εντοπίζει πρωτεΐνες οι οποίες αλληλεπιδρούν άμεσα με τη μεμβράνη και να τις διαχωρίζει με βάση τον τρόπο αλληλεπίδρασης τους σε περιφερειακές ή διαμεμβρανικές. Μία διαδικτυακή έκδοση της μεθόδου βρίσκεται διαθέσιμη στην ιστοσελίδα http://bioinformatics.biol.uoa.gr/MBPpred/. Για την κατασκευή της μεθόδου MBPpred αρχικά έγινε εκτεταμένη έρευνα στη βιβλιογραφία για την εύρεση αυτοτελών δομικών και λειτουργικών περιοχών που αρκούν για να διαχωριστούν οι μεμβρανικές πρωτεΐνες που αλληλεπιδρούν με λιπίδια της μεμβράνης από άλλες κατηγορίες πρωτεϊνών. Από αυτή την έρευνα προέκυψε ότι υπάρχουν 18 αυτοτελείς δομικές περιοχές, οι οποίες σχετίζονται με τη μη ομοιοπολική αλληλεπίδραση πρωτεϊνών με συγκεκριμένα λιπίδια της μεμβράνης σε ευκαρυωτικούς οργανισμούς. Για τις συγκεκριμένες αυτοτελείς δομικές περιοχές έγινε αναζήτηση στη βάση δεδομένων πρωτεϊνικών οικογενειών Pfam και απομονώθηκε τουλάχιστον ένα pHMM για κάθε μία από αυτές. Τα pHMMs που απομονώθηκαν χρησιμοποιήθηκαν για να κατασκευαστεί μία βιβλιοθήκη η οποία περιέχει 40 προφίλ. Εν συνεχεία, έγινε χρήση του πακέτου λογισμικού HMMER, για τον εντοπισμό πρωτεϊνών οι οποίες περιέχουν κάποια από αυτές τις αυτοτελείς δομικές περιοχές στην ακολουθία τους. Τέλος, για πρωτεΐνες που φέρουν τις συγκεκριμένες αυτοτελείς περιοχές έγινε διαχωρισμός με χρήση του αλγορίθμου PredClass, ανάλογα με τον τρόπο με τον οποίο αλληλεπιδρούν με τη μεμβράνη σε περιφερειακές ή διαμεμβρανικές πρωτεΐνες. Η συγκεκριμένη μέθοδος εφαρμόστηκε σε 407 καλά σχολιασμένα ευκαρυωτικά πρωτεώματα, τα οποία απομονώθηκαν από τη UniProt και παρατηρήθηκε η κατανομή των πρωτεϊνών αυτών στα διάφορα βασίλεια των ευκαρυωτικών οργανισμών. Επίσης, πραγματοποιήθηκε, μέσω της εφαρμογής της μεθόδου, αναζήτηση ομολόγων των ευκαρυωτικών πρωτεϊνών, σε 2760 προκαρυωτικά πρωτεώματα (Βακτηρίων και Αρχαίων). Στη συνέχεια, σε μία προσπάθεια να συλλεχθεί το σύνολο της πληροφορίας που αφορά στις περιφερειακές μεμβρανικές πρωτεΐνες ευκαρυωτικών οργανισμών, σχεδιάστηκε και κατασκευάστηκε η βάση δεδομένων PerMemDB. Επί του παρόντος, η PerMemDB αποτελεί το πιο ολοκληρωμένο αποθετήριο δεδομένων για περιφερειακές μεμβρανικές πρωτεΐνες, οι οποίες είτε βρίσκονται κατατεθειμένες στη βάση δεδομένων πρωτεϊνικών ακολουθιών UniProt ή έχουν ταυτοποιηθεί με τη μέθοδο MBPpred. Η πρώτη έκδοση της βάσης δεδομένων περιέχει 231770 εγγραφές περιφερειακών μεμβρανικών πρωτεϊνών από 1009 ευκαρυωτικούς οργανισμούς. Όλες οι εγγραφές της βάσης έχουν υπερσυνδέσμους προς άλλες βάσεις δεδομένων, βιβλιογραφικές αναφορές και πληροφορίες για τις αλληλεπιδράσεις τους με άλλες πρωτεΐνες. Επιπλέον, παρέχεται περαιτέρω σχολιασμός της πρωτεϊνικής ακολουθίας σε ότι αφορά τις χαρακτηριστικές αυτοτελείς δομικές και λειτουργικές περιοχές των περιφερειακών μεμβρανικών πρωτεϊνών. Μέσω της διαδικτυακής διεπαφής της βάσης, οι χρήστες μπορούν να πλοηγηθούν στα περιεχόμενά της, να υποβάλουν αναζητήσεις και να εκτελέσουν επερωτήσεις για την εύρεση ομόλογων ακολουθιών μέσω του εργαλείου BLAST. Η βάση δεδομένων είναι δημόσια διαθέσιμη μέσω του συνδέσμου http://bioinformatics.biol.uoa.gr/db=permemdb Οι διαμεμβρανικές πρωτεΐνες είναι η περισσότερο μελετημένη κατηγορία μεμβρανικών πρωτεϊνών και έχει βρεθεί ότι αποτελούν περίπου το 20-30% των πρωτεϊνών των γνωστών πρωτεωμάτων. Οι πρωτεΐνες αυτές επιτελούν πολύ σημαντικές κυτταρικές λειτουργίες, όπως η μεταφορά ουσιών και η μεταγωγή σήματος, ενώ ταυτόχρονα συμμετέχουν στη ρύθμιση της λιπιδικής σύστασης των μεμβρανών και τη συγκρότηση και διατήρηση του σχήματος των μεμβρανών και του κυττάρου. Τα κανάλια ιόντων είναι διαμεμβρανικές πρωτεΐνες, οι οποίες σχηματίζουν πόρους που επιτρέπουν τη διέλευση ιόντων και συνεπώς τη μετακίνηση τους εντός και εκτός του κυττάρου. Οι πρωτεΐνες αυτές ελέγχουν τις ηλεκτρικές ιδιότητες των μεμβρανών διεγέρσιμων κυττάρων και είναι εξαιρετικά σημαντικές για πολλές λειτουργίες, όπως η αναπαραγωγή και η μετάδοση ηλεκτρικών σημάτων στα μυϊκά και νευρικά κύτταρα και η έκκριση ορμονών. Στη παρούσα διατριβή επικεντρωθήκαμε στις δύο σημαντικότερες οικογένειες καναλιών ιόντων, τα τασεοελεγχόμενα κανάλια ιόντων και τα κανάλια ιόντων που ελέγχονται από προσδέτες. Τα τασεοελεγχόμενα κανάλια ιόντων είναι μία από τις μεγαλύτερες ομάδες διαμεμβρανικών πρωτεϊνών. Λόγω του κεντρικού ρόλου τους στην παραγωγή και τη μετάδοση ηλεκτρικών σημάτων, πιθανή αλλοίωση των συγκεκριμένων πρωτεϊνών έχει ως συνέπεια την πρόκληση σημαντικών ασθενειών, οι οποίες είναι γνωστές ως καναλοπάθειες. Στην παρούσα μελέτη ταυτοποιήθηκαν απλοί και παθογόνοι πολυμορφισμοί των ανθρώπινων τασεοελεγχόμενων καναλιών ιόντων από τις βάσεις δεδομένων UniProt και ClinVar και αποτυπώθηκαν στις αμινοξικές ακολουθίες των πρωτεϊνών αυτών, λαμβάνοντας υπόψη τα ιδιαίτερα δομικά και λειτουργικά τους χαρακτηριστικά. Ακολούθησε στατιστική ανάλυση η οποία έδειξε ότι οι παρερμηνεύσιμοι μονονουκλεοτιδικοί πολυμορφισμοί με τη μεγαλύτερη σημαντικότητα εντοπίζονται στον αισθητήρα τάσης και στον βρόχο του πόρου, δύο περιοχές με εξαιρετική σημασία για την ενεργοποίηση και τη ροή ιόντων διαμέσου των συγκεκριμένων καναλιών. Επιπρόσθετα, μεταξύ των πιο συχνά παρατηρούμενων μεταλλαγών ανήκουν αυτές από αργινίνη σε γλουταμίνη, ιστιδίνη ή κυστεΐνη, υπερτονίζοντας τον εξαιρετικά σημαντικό ρόλο των καταλοίπων αργινίνης στη ρύθμιση του δυναμικού της μεμβράνης, που επιτελείται από τις συγκεκριμένες πρωτεΐνες. Η παρούσα μελέτη δείχνει ότι ο συνδυασμός των ιδιαίτερων τοπολογικών χαρακτηριστικών των τασεοελεγχόμενων καναλιών ιόντων με τα δεδομένα των γενετικών αλλαγών μπορεί να συμβάλλει σημαντικά στην εκτίμηση της κλινικής ταυτότητας των μέχρι σήμερα αταξινόμητων μονονουκλεοτιδικών πολυμορφισμών. Επιπλέον, μπορεί δυνητικά να επιτρέψει τη συσχέτιση με συγκεκριμένους φαινοτύπους καναλοπαθειών.Τα κανάλια ιόντων που ελέγχονται από προσδέτες είναι διαμεμβρανικές πρωτεΐνες που περιέχουν έναν πόρο που επιτρέπει τη ρυθμιζόμενη από τη διαφορά δυναμικού παθητική ροή επιλεγμένων ιόντων, μέσω της κυτταρικής μεμβράνης. Η δέσμευση ενός προσδέτη, σε μία ή περισσότερες ορθοστερικές θέσεις, οδηγεί σε αλλαγή της στερεοδιάταξής τους και ως εκ τούτου στο άνοιγμα τους. Παρότι μέχρι σήμερα έχουν αναπτυχθεί αρκετές μέθοδοι οι οποίες επιτρέπουν την ταυτοποίηση και την πρόγνωση τασεοελεγχόμενων καναλιών ιόντων, δεν ισχύει το ίδιο για τα κανάλια ιόντων που ελέγχονται από προσδέτες, όπου παρά τη σημαντικότητα τους καμία μέθοδος που να αφορά στην κατηγοριοποίηση τους στις διάφορες υπο-οικογένειες δεν είναι δημόσια διαθέσιμη. Για τον λόγο αυτό αναπτύχθηκε η προγνωστική μέθοδος LiGioNs, η οποία επιτρέπει τον εντοπισμό καναλιών ιόντων που ελέγχονται από προσδέτες και την κατηγοριοποίησή τους σε υπο-οικογένειες. Η μέθοδος βρίσκει εφαρμογή σε ολόκληρα πρωτεώματα και αποτελείται από δύο διακριτά τμήματα, το τμήμα της πρόγνωσης και το τμήμα του σχολιασμού. Για το προγνωστικό τμήμα κατασκευάστηκε μία βιβλιοθήκη με 35 pHMMs από στοιχίσεις των διαμεμβρανικών τμημάτων των καναλιών ιόντων που ελέγχονται από προσδέτες, τα οποία ανήκουν στις 10 γνωστές υπο-οικογένειες αυτών των πρωτεϊνών. Για το τμήμα σχολιασμού δημιουργήθηκε μία βιβλιοθήκη με 14 pHMMs τα οποία εντοπίζονται στα κανάλια αυτά και έχουν καταγραφεί στη βάση δεδομένων Pfam. Η μέθοδος LiGioNs εφαρμόστηκε σε 30 πρωτεώματα αναφοράς και είναι δημόσια διαθέσιμη μέσω της διαδικτυακής διεπαφής http://bioinformatics.biol.uoa.gr/ligions. Ένας άλλος εξαιρετικά σημαντικός στόχος που προέκυψε στην πορεία της διατριβής, έπειτα από την εις βάθος ενασχόληση και τη μελέτη της σχέσης των περιφερειακών μεμβρανικών πρωτεϊνών με ασθένειες, ήταν η μελέτη της άμεσης ή έμμεσης αλληλεπίδρασης των μεμβρανικών πρωτεϊνών με μία ιδιαίτερη ομάδα πρωτεϊνών, τις αμυλοειδογόνες πρωτεΐνες. Οι πρωτεΐνες αυτές, κάτω από μη φυσιολογικές συνθήκες, αδυνατούν να αποκτήσουν ή να διατηρήσουν τη φυσιολογική τους στερεοδιάταξη και οδηγούνται σε ένα εναλλακτικό, μη κανονικό δίπλωμα της πολυπεπτιδικής τους αλυσίδας στο χώρο. Αυτά τα «λάθος» διπλωμένα πρωτεϊνικά μόρια αυτοσυγκροτούνται σε οργανωμένα πρωτεϊνικά συσσωματώματα, που ονομάζονται αμυλοειδή ινίδια. Στον άνθρωπο, τα αμυλοειδή ινίδια μπορούν να προσβάλουν διάφορα όργανα ή ιστούς και να οδηγήσουν σε στερεοδιαταξικές ασθένειες, γνωστές ως αμυλοειδώσεις, πιθανόν λόγω της τοξικότητας που προκαλούν στην περιοχή συσσώρευσής τους. Πολλά βιβλιογραφικά δεδομένα υποδεικνύουν την εμπλοκή συνήθως δύο ή και περισσότερων πρωτεϊνών, στην εξέλιξη τέτοιων παθολογικών καταστάσεων.Σε μία προσπάθεια μελέτης της αλληλεπίδρασης των αμυλοειδογόνων πρωτεϊνών με μεμβρανικές πρωτεΐνες κατασκευάστηκε το δίκτυο των πρώτων (Amyloid Interactome). Το Amyloid Interactome κατάφερε να συσχετίσει το σύνολο των φαινομενικά ασυσχέτιστων αμυλοειδογόνων πρωτεϊνών, μέσω της αποκάλυψης σημαντικών διασυνδέσεων τόσο μεταξύ των ίδιων των αμυλοειδογόνων, όσο και άλλων πρωτεϊνών του δικτύου και κατόρθωσε να αναδείξει σημαντικές πρωτεΐνες με καίριο ρόλο στο σύνολο των αμυλοειδώσεων. Ειδικότερα, η κατηγοριοποίηση των στοιχείων του δικτύου με βάση την υποκυτταρική τους θέση κατέδειξε τη σημαντικότητα των μεμβρανικών πρωτεϊνών, και ιδιαίτερα όσων εντοπίζονται σε λιπιδικές σχεδίες, τόσο στην επαγωγή όσο και στον έλεγχο της κυτταροτοξικότητας που προκαλείται από την εναπόθεση αμυλοειδών ινιδίων, ιδιαίτερα στη νόσο του Alzheimer. Στη προσπάθεια μας να μελετήσουμε σε βάθος όλες τις ασθένειες που σχετίζονται με την εναπόθεση αμυλοειδών ινιδίων, προβήκαμε σε εκτεταμένο βιβλιογραφικό έλεγχο, ο οποίος οδήγησε στην κατασκευή μίας βάσης δεδομένων, η οποία συγκεντρώνει και κατηγοριοποιεί την ετερογενή ομάδα των ασθενειών που σχετίζονται με την εναπόθεση αμυλοειδών ινιδίων και περιέχει πληροφορίες για το σύνολο των πρωτεϊνών που εντοπίζονται σε αμυλοειδείς εναποθέσεις. Η βάση δεδομένων που δημιουργήθηκε ονομάζεται AmyCo, είναι δημόσια διαθέσιμη και περιέχει πληροφορία για 75 ασθένειες και 83 πρωτεΐνες (http://bioinformatics.biol.uoa.gr/amyco/). Σε δεύτερο στάδιο πραγματοποιήθηκε μελέτη δικτύων ασθενειών για τις σπάνιες αμυλοειδώσεις που καταγράφηκαν στην AmyCo, χρησιμοποιώντας δεδομένα για πρωτεΐνες που προέκυψαν τόσο από τη βιβλιογραφική μας μελέτη, όσο και από την εξόρυξη κειμένου. Όπως και στη περίπτωση του Amyloid Interactome, έτσι και στα δίκτυα που δημιουργήθηκαν για το σύνολο των διαφορετικών αμυλοειδώσεων κατεδείχθησαν πιθανές ομοιότητες στον υποκείμενο μηχανισμό της αμυλοειδογένεσης, μεταξύ των διαφόρων ασθενειών. Επιπρόσθετα, τονίστηκε για ακόμη μία φορά η σημαντικότητα του ρόλου των λιπιδικών σχεδιών, της κυτταρικής μεμβράνης και των μεμβρανικών πρωτεϊνών, τόσο στην πρόληψη όσο και στην αναστολή της δημιουργίας αμυλοειδών ινιδίων και αναδείχθηκε πληθώρα σημαντικών πρωτεϊνικών στόχων με πιθανές προεκτάσεις στην ανάπτυξη νέων θεραπευτικών τακτικών για το σύνολο των αμυλοειδώσεων. Συνολικά, η συγκεκριμένη υπολογιστική προσέγγιση θέτει πλήθος ερωτημάτων που θα μπορούσαν να αξιοποιηθούν για το μελλοντικό σχεδιασμό στοχευμένων πειραματικών προσεγγίσεων κατά τη μελέτη της αμυλοειδογόνικότητας.Membrane proteins are one of the most multitudinous groups of cellular proteins, performing a series of very important functions, including cellular recognition, molecular reception, passive or active substance transfer via the membrane and specific enzymatic activities. It is thus readily understood that any potential alteration of membrane proteins can theoretically lead to disease. Therefore, these proteins can be the target of drugs, that either enhance or inhibit their function. In general, these proteins are classified into three groups, depending on how they interact with the membrane; transmembrane proteins that permeate the lipid bilayer with their polypeptide chains, peripheral membrane proteins that interact with membrane proteins or lipids non-covalently, and lipid-anchored proteins which interact with membrane lipids covalently.In the present thesis, we conducted A) an analysis of structural and functional characteristics of membrane proteins, which allowed for B) the design and development of computational methods for the identification of membrane proteins in proteomes and C) the construction of a database for the collection and recording of information for a subset of membrane proteins. Moreover, D) the interactions between membrane proteins and other biomolecules were studied, in order to decipher their role in human diseases.Peripheral membrane proteins are the most understudied group of membrane proteins, a fact that doesn’t undermine their importance, but rather stresses the need for their extensive study. As mentioned above, these proteins can interact with membrane surfaces non-covalently either via membrane lipids (direct interactions) or via membrane proteins (indirect interactions). Directly interacting membrane proteins usually have domains that allow for the specific or non-specific interaction with membrane lipids (Membrane Binding Domains – MBDs). Peripheral membrane proteins, and especially those located on lipid rafts, are of great importance to the cell, since they participate in a variety of vital cellular processes, such as cell signaling and membrane trafficking.In this thesis, we developed MBPpred, a profile Hidden Markov Model based method capable of detecting Membrane Binding Proteins (MBPs) from information encoded in their amino acid sequence. MBPpred is available online at http://bioinformatics.biol.uoa.gr/MBPpred. After an extensive literature search, 18 domains were identified, for which well-established biochemical and crystallographic experimental data for their interactions with membrane lipids exist. Each of these domains was mapped to at least one characteristic pHMM from the Pfam database. Subsequently, a pHMM library containing 40 pHMMs that were derived from Pfam was created and was used for the detection of Membrane Binding Proteins (MBPs). Afterwards, the PredClass algorithm was used in order to further classify MBPs, in respect to their interaction with the membrane, into peripheral or transmembrane. MBPpred was applied in selected eukaryotic proteomes, to examine the characteristics they exhibit in various eukaryotic kingdoms and phylums. Moreover, a search for homologous sequences in prokaryotic proteomes was performed.Subsequently, in an effort to collect data regarding this heterogeneous group of proteins, we designed and constructed a database, called PerMemDB. PerMemDB is currently the most complete and comprehensive repository of data for eukaryotic peripheral membrane proteins deposited in UniProt or predicted with the use of MBPpred. The first version of the database contains 231770 peripheral membrane proteins from 1009 organisms. All entries have cross-references to other databases, literature references and annotation regarding their interactions with other proteins. Moreover, additional sequence annotation of the characteristic domains that allow these proteins to interact with membranes is available, due to the application of MBPpred. Through the web interface of PerMemDB, users can browse the contents of the database, submit advanced text searches and BLAST queries against the protein sequences deposited in PerMemDB. The database is publicly available at http://bioinformatics.biol.uoa.gr/db=permemdb. Transmembrane proteins are the most studied group of membrane proteins and account for 20-30% of all known proteins. These proteins perform extremely important molecular functions, like substrate transport and signal transduction, while simultaneously participating in the regulation of membrane lipid composition and the maintenance of the cell’s shape. Ion channels are transmembrane proteins, which form pores that permit ion conductance inside and outside of the cell, via the membrane. These proteins control the electrical properties of the membranes of excitable cells and are extremely important for the production and transmission of electrical signals to muscular and neuronal cells and hormone secretion. In this thesis we focused on the two most important families of ion channels, Voltage-gated Ion Channels and Ligand-gated Ion Channels.Voltage-gated Ion Channels (VGICs) are one of the largest groups of transmembrane proteins. Due to their major role in the generation and propagation of electrical signals, VGICs are considered important from a medical viewpoint and their dysfunction is often associated with “Channelopathies”. In this study, we identified disease associated mutations and polymorphisms in these proteins through mapping missense Single Nucleotide Polymorphisms (SNPs) from the UniProt and ClinVar databases on their amino acid sequence, considering their special topological and functional characteristics. Statistical analysis revealed that disease associated SNPs are mostly found in the Voltage Sensor Domain and the Pore Loop. Both these regions are extremely important for the activation and ion conductivity of VGICs. Moreover, amongst the most frequently observed mutations are those of arginine to glutamine, to histidine or to cysteine, which can probably be attributed to the extremely important role of arginine residues in the regulation of membrane potential in these proteins. We suggest that topological information in combination with genetic variation data can contribute towards a better evaluation of the effect of currently unclassified mutations in VGICs and we hope that potential associations with certain disease phenotypes will be revealed in the future, with the use of similar approaches.Ligand-gated Ion Channels (LGICs) are transmembrane proteins that contain a pore that allows for passive ion influx, controlled via the potential difference in the cell membrane. Due to their major role in synaptic transmission, both in the nervous system and the somatic neuromuscular junction, LGICs present attractive therapeutic targets. During the last few years several computational methods for the detection and classification of LGICs have been developed. These methods are based on machine learning approaches, utilizing features extracted solely from amino acid composition. However, special topological characteristics of these proteins have not been utilized to date, which results in weaknesses regarding the correct class categorization of predicted proteins. Here we report the development of a profile Hidden Markov Model method for the prediction and ligand-based classification of LGICs, utilizing their special topological characteristics. The method consists of a library of 35 pHMMs, built from the alignment of transmembrane segments of representative LGIC sequences. In addition,14 Pfam pHMMs are used to further annotate and correctly classify unknown protein sequences into one of the 10 LGIC classes. Evaluation of the method showed that it outperforms existent methods both in the detection of LGICs and their correct categorization. A web interface for the method is available online at http://bioinformatics.biol.uoa.gr/ligions/ .After an in-depth study of the relationship between peripheral membrane proteins and diseases, the important role of membrane proteins in a group of heterogeneous dise
    corecore