8 research outputs found
A web-based crystallographic tool for the construction of nanoparticles
Τα νανοσωματίδια έχουν διάφορες εφαρμογές στην ιατρική, τη φυσική, την οπτική και την ηλεκτρονική. Η μοντελοποίηση νανοσωματιδίων είναι ένα ουσιαστικό πρώτο βήμα για να εκτιμηθεί η ικανότητα τους σε διάφορες χρήσεις όπως η αποθήκευση ενέργειας ή η μεταφορά φαρμάκων. Ωστόσο, η δημιουργία μιας αρχικής σύνθεσης για μοντελοποίηση και προσομοίωση είναι κουραστική, επειδή κάθε κρύσταλλος αναπτύσσεται με διαφορετικό crystal habit και διαφορετική συμμετρία στη φύση.
Σε αυτή τη διπλωματική εργασία, δημιουργήθηκε ένα διαδικτυακό κρυσταλλογραφικό εργαλείο, το οποίο δημιουργεί μοντέλα νανοσωματιδίων από οποιαδήποτε κρυσταλλική δομή σύμφωνα με το προτιμώμενο σχήμα ισορροπίας τους σε τυπικές συνθήκες σύμφωνα με τη μορφολογία Wulff (crystal habit).
Ο αλγόριθμος χρησιμοποιεί δεδομένα από κβαντομηχανικούς υπολογισμούς βάσει της κατασκευής Wulff. Η κατασκευή Wulff χρησιμοποιεί παραμέτρους ελαχιστοποίησης της ενέργειας για να καταδείξει ότι ορισμένες έδρες προτιμώνται σε σχέση με άλλες, καθώς η απόστασή τους από το κέντρο είναι ανάλογη με την ενέργεια της επιφάνειας τους. Οι παράμετροι εισόδου για τον προσδιορισμό αυτής της δομής νανοσωματιδίων σε ισορροπία είναι οι έδρες που προτιμώνται να αναπτύσσονται, ως δείκτες Miller, η ενέργεια κάθε επιπέδου και το επιθυμητό μέγεθος του νανοσωματιδίου.
Μετά την εισαγωγή αυτών των παραμέτρων, το σχήμα ισορροπίας δημιουργείται με την ακόλουθη μεθοδολογία. Πρώτον, με βάση την κρυσταλλογραφική τάξη, οι συμμετρικές έδρες παράγονται με βάση τους δείκτες Miller, το κλασματικό σύστημα συντεταγμένων και τις παραμέτρους του κρυσταλλικού πλέγματος. Σε αυτή τη διαδικασία, τοποθετούμε την αρχή των αξόνων στην αρνητική πλευρά αυτών των εδρών και στη συνέχεια υπολογίζουμε τα σημεία τομής ανά τρις έδρες, απορρίπτοντας αυτά που βρίσκονται στη θετική πλευρά τουλάχιστον ενός εκ των εδρών. Στη συνέχεια, λαμβάνουμε τις όψεις του σχήματος ισορροπίας χρησιμοποιώντας τον αλγόριθμο Quickhull στα εναπομείναντα σημεία τομής και το σχήμα ισορροπίας κατασκευάζεται συνδέοντας αυτές τις όψεις. Η στοιχειώδης κυψελίδα της κρυσταλλικής δομής παράγεται από την ασύμμετρη κυψελίδα, χρησιμοποιώντας πάλι τις παραμέτρους του κρυσταλλικού πλέγματος και τις λειτουργίες συμμετρίας της κρυσταλλογραφικής χωρο-ομάδας στις συντεταγμένες των ατόμων. Τέλος, το νανοσωματίδιο κατασκευάζεται με την αντιγραφή της στοιχειώδης κυψελίδας και στις τρεις χωρικές διευθύνσεις, μέχρις ότου γεμίσει το σχήμα ισορροπίας με αποτέλεσμα οι συντεταγμένες των ατόμων να εξάγονται στον χρήστη.
Αυτό το εργαλείο μπορεί να χρησιμοποιηθεί για την κατασκευή νανοσωματιδίων για προσομοίωση οποιουδήποτε υλικού, δεδομένης της κρυσταλλικής δομής ως είσοδο, του μεγέθους του νανοσωματιδίου και των προτιμώμενων εδρών ανάπτυξης και των ενεργειών τους. Έχει κατασκευαστεί ως διαδικτυακή σελίδα χρησιμοποιώντας τις προγραμματιστικές γλώσσες C++ και PHP και μπορεί να προσπελαστεί και να χρησιμοποιηθεί στην ιστοσελίδα: http://nanocrystal.vi-seem.eu/CrystalTool.
ΘΕΜΑΤΙΚΗ ΠΕΡΙΟΧΗ: Φυσική Συμπυκνωμένης Ύλης
ΛΕΞΕΙΣ ΚΛΕΙΔΙΑ: κρυσταλλογραφία, νανοσωματίδια, κατασκευή Wulff, σχεδιασμός νανοσωματιδίων, ανάπτυξη διαδικτυακού εργαλείουNanoparticles have various applications in medicine, physics, optics, and electronics. Modeling nanoparticles is an essential first step to assess their capacity in different uses such as in energy storage or drug delivery. However, creating an initial starting conformation for modeling and simulation is tedious, because every crystalline material grows with a different crystal habit and different symmetry in nature.
In this diploma thesis, a web-based crystallographic tool has been created, which creates nanoparticle models from any crystal structure guided by their preferred equilibrium shape in standard conditions according to Wulff morphology (crystal habit).
The algorithm uses input from quantum mechanical calculations based on the Wulff construction. The Wulff construction employs energy minimization arguments to demonstrate that specific crystal planes are preferred over others, with their distance from the origin being proportional to their surface energy. The input parameters for determining this equilibrium nanoparticle structure are the preferred growing planes as Miller indices, the energy of each plane, and the desired size of the nanoparticle.
After inputting this data, the equilibrium shape is created with the following methodology. First, based on the crystallographic point group, the symmetric planes are produced based on the Miller indices, the fractional coordination system, and the lattice parameters. In this procedure, we place the origin on the negative side of these planes, and then we calculate the intersection points per three of the planes, discarding those that are on the positive side of at least one of the planes. Then, we obtain the faces of the equilibrium shape using the Quickhull algorithm on the remaining intersection points, and the equilibrium shape is constructed by connecting these faces. The symmetric unit cell of the crystal structure is produced from the asymmetric one, using the lattice parameters and the symmetry operations of the crystallographic space group on the coordinates of the atoms again. Finally, the nanoparticle is constructed by replication of the unit cell across all three spatial directions, until the equilibrium shape is filled, and the coordinates of the atoms are output to the user.
This tool may be used to construct nanoparticles for simulation of any material given the crystal structure as input, the size of the nanoparticle, and the preferred growing planes and energies. It has been implemented as a website using C++ and PHP and can be accessed and used at: http://nanocrystal.vi-seem.eu/CrystalTool.
SUBJECT AREA: Condensed Matter Physics
KEYWORDS: crystallography, nanoparticles, Wulff construction, modeling nanoparticles, web developmen
Ανάπτυξη υπολογιστικής μεθοδολογίας για τον ορθολογικό σχεδιασμό φαρμάκων που στοχεύουν σε περιφερικές μεμβρανικές πρωτεΐνες
Abnormal protein-membrane attachment is involved in deregulated cellular pathways and in disease. Therefore, the possibility to modulate protein-membrane interactions represents a new promising therapeutic strategy for peripheral membrane proteins that have been considered so far undruggable. Currently, the lack of a suitable theoretical background, experimental data, and simulation technology capable to implement this drug design strategy leads to high development costs of small molecules targeting this interface. The aim of this dissertation is to implement a novel drug design workflow for targeting protein-membrane interfaces by developing new algorithms used complementary to existing methods using the following steps: 1. Development of a fast and efficient algorithm predicting the protein-membrane interfaces of peripheral membrane proteins using machine learning. 2. Development of a drug design workflow for targeting the protein-membrane interfaces and implementing it in a web-server. 3. Identification of allosteric networks connecting membrane-binding domains using existing methodologies using PI3Kα and K-Ras4B as test cases. 4. Development of a new algorithm for the prediction of allosteric networks using deep learning. To design a new algorithm for the prediction of the protein-membrane interfaces using machine learning (step 1), first a dataset of peripheral membrane proteins with experimentally known membrane-penetrating amino acids was assembled. Physicochemical features related to the penetration of amino acids into the membrane were used to train 21 different classifiers and voting classifiers. Evaluation of the ensemble classifier accuracy produced a macro-averaged F1 score = 0.92 and an MCC = 0.84 for predicting correctly membrane-penetrating amino acids on unknown proteins of a validation set. Predictions were further verified in independent test sets. The python code is available at https://github.com/zoecournia/DREAMM. This algorithm was integrated into our workflow for determining binding sites in the predicted protein-membrane interfaces (step 2). In this workflow, small molecule binding sites in multiple protein structural conformations are identified and, only the sites located adjacent to the predicted membrane-penetrating amino acids are selected. The workflow was integrated into a web-server, which was onboarded in the European Open Science Cloud at https://dreamm.ni4os.eu/. In order for the identified binding sites to be functional, they need to communicate with the active site of the protein through allosteric networks. We thus applied existing allosteric network prediction methodologies for the study of two membrane oncoproteins PI3Kα and K-Ras4B as test cases (step 3). Finally, we aimed at creating a novel tool for predicting and evaluating the allosteric cross-linking of protein amino acids (step 4). To this end, we trained Graph Neural Networks (GNNs) in molecular dynamics simulations of 147 proteins. Structural and evolutionary-based characteristics were calculated, and GNNs were trained with the aim of predicting the allosteric cross-linking of amino acids. This tool is expected to predict allosteric networks in novel proteins without the need of molecular dynamics simulations.Η μη φυσιολογική σύνδεση πρωτεΐνης-μεμβράνης εμπλέκεται σε απορυθμισμένα σηματοδοτικά μονοπάτια και σε ασθένειες. Ως εκ τούτου, η δυνατότητα ρύθμισης των αλληλεπιδράσεων πρωτεΐνης-μεμβράνης αποτελεί μια νέα υποσχόμενη θεραπευτική στρατηγική για περιφερικές μεμβρανικές πρωτεΐνες που θεωρούνται φαρμακολογικά δυσπρόσιτες. Η έλλειψη κατάλληλου θεωρητικού υποβάθρου, πειραματικών δεδομένων και τεχνικών προσομοίωσης ικανών να εφαρμόσουν αυτήν τη στρατηγική σχεδιασμού φαρμάκων οδηγεί σε υψηλό κόστος ανάπτυξης μικρών μορίων που στοχεύουν αυτή τη διεπιφάνεια. Ο στόχος της παρούσας διδακτορικής διατριβής είναι η δημιουργία μιας καινοτόμου ροής εργασίας σχεδιασμού φαρμάκων για τη στόχευση της διεπιφάνειας πρωτεΐνης-μεμβράνης, αναπτύσσοντας νέους αλγορίθμους που χρησιμοποιούνται συμπληρωματικά με τις υπάρχουσες μεθόδους χρησιμοποιώντας τα ακόλουθα βήματα: 1. Ανάπτυξη ενός γρήγορου και αποτελεσματικού αλγορίθμου που προβλέπει τις διεπιφάνειες πρωτεΐνης-μεμβράνης των περιφερειακών μεμβρανικών πρωτεϊνών με χρήση μηχανικής μάθησης. 2. Ανάπτυξη μιας ροής εργασίας σχεδιασμού φαρμάκων για τη στόχευση των διεπιφανειών πρωτεΐνης-μεμβράνης και υλοποίησή της σε διαδικτυακή πλατφόρμα. 3. Προσδιορισμός αλλοστερικών δικτύων που συνδέουν τις περιοχές δέσμευσης στη μεμβράνη εφαρμόζοντας υπάρχουσες μεθοδολογίες χρησιμοποιώντας τις ογκοπρωτεΐνες PI3Kα και K-Ras4B ως περιπτωσιολογικές μελέτες. 4. Ανάπτυξη νέου αλγορίθμου για την πρόβλεψη αλλοστερικών δικτύων με χρήση βαθιάς μάθησης. Για να σχεδιάσουμε έναν νέο αλγόριθμο για την πρόβλεψη της διεπιφάνειας πρωτεΐνης-μεμβράνης (βήμα 1), συγκεντρώσαμε μία βάση δεδομένων αποτελούμενη από περιφερικές μεμβρανικές πρωτεΐνες με πειραματικά γνωστά αμινοξέα που διεισδύουν στη μεμβράνη. Τα φυσικοχημικά χαρακτηριστικά που σχετίζονται με τη διείσδυση αμινοξέων στη μεμβράνη χρησιμοποιήθηκαν για την εκπαίδευση 21 διαφορετικών ταξινομητών και μετα-ταξινομητών. Η αξιολόγηση της ακρίβειας του τελικού ταξινομητή παρουσίασε βαθμολογία F1 = 0,92 και MCC = 0,84 για την σωστή πρόβλεψη αμινοξέων που διεισδύουν στη μεμβράνη σε άγνωστες πρωτεΐνες ενός συνόλου επικύρωσης. Οι προβλέψεις επαληθεύτηκαν περαιτέρω σε ανεξάρτητα σύνολα δοκιμών. Ο κώδικας είναι διαθέσιμος στη διεύθυνση https://github.com/zoecournia/DREAMM. Αυτός ο αλγόριθμος ενσωματώθηκε στη ροή εργασίας μας για τον προσδιορισμό των κοιλοτήτων πρόσδεσης στη διεπιφάνεια πρωτεΐνης-μεμβράνης (βήμα 2). Σε αυτή τη ροή εργασίας, αναγνωρίζονται κοιλότητες πρόσδεσης μικρών μορίων σε πολλαπλές δομικές διαμορφώσεις πρωτεϊνών και επιλέγονται μόνο οι θέσεις που βρίσκονται δίπλα στα αμινοξέα που διεισδύουν στη μεμβράνη. Η ροή εργασίας ενσωματώθηκε σε διαδικτυακή πλατφόρμα, η οποία εντάχθηκε στο European Open Science Cloud στη διεύθυνση https://dreamm.ni4os.eu/. Προκειμένου οι εντοπισμένες κοιλότητες πρόσδεσης να είναι λειτουργικές, πρέπει να επικοινωνούν με τo ενεργό κέντρο της πρωτεΐνης μέσω αλλοστερικών δικτύων. Γι’ αυτό, εφαρμόσαμε υπάρχουσες μεθοδολογίες πρόβλεψης αλλοστερικών δικτύων για τη μελέτη δύο μεμβρανικών ογκοπρωτεϊνών, PI3Kα και K-Ras4B, ως περιπτωσιολογικές μελέτες (βήμα 3). Τέλος, στοχεύσαμε στη δημιουργία ενός νέου εργαλείου για την πρόβλεψη και την αξιολόγηση της αλλοστερικής διασύνδεσης των αμινοξέων (βήμα 4). Για το σκοπό αυτό, εκπαιδεύσαμε νευρωνικά δίκτυα γράφων (GNNs) σε προσομοιώσεις μοριακής δυναμικής 147 πρωτεϊνών. Υπολογίστηκαν δομικά και εξελικτικά χαρακτηριστικά και εκπαιδεύτηκαν GNNs με στόχο την πρόβλεψη της αλλοστερικής διασύνδεσης των αμινοξέων. Αυτό το εργαλείο αναμένεται να προβλέπει τα αλλοστερικά δίκτυα σε νέες πρωτεΐνες χωρίς την ανάγκη προσομοιώσεων μοριακής δυναμικής
Predicting protein-membrane interfaces of peripheral membrane proteins using ensemble machine learning.
Abnormal protein-membrane attachment is involved in deregulated cellular pathways and in disease. Therefore, the possibility to modulate protein-membrane interactions represents a new promising therapeutic strategy for peripheral membrane proteins that have been considered so far undruggable. A major obstacle in this drug design strategy is that the membrane-binding domains of peripheral membrane proteins are usually unknown. The development of fast and efficient algorithms predicting the protein-membrane interface would shed light into the accessibility of membrane-protein interfaces by drug-like molecules. Herein, we describe an ensemble machine learning methodology and algorithm for predicting membrane-penetrating amino acids. We utilize available experimental data from the literature for training 21 machine learning classifiers and meta-classifiers. Evaluation of the best ensemble classifier model accuracy yields a macro-averaged F1 score = 0.92 and a Matthews correlation coefficient = 0.84 for predicting correctly membrane-penetrating amino acids on unknown proteins of a validation set. The python code for predicting protein-membrane interfaces of peripheral membrane proteins is available at https://github.com/zoecournia/DREAMM
NanoCrystal: A Web-Based Crystallographic Tool for the Construction of Nanoparticles Based on Their Crystal Habit
Modeling nanoparticles is an essential first step to assess their capacity in different uses such as in energy storage or drug delivery. However, creating an initial starting conformation for modeling and simulation is tedious because every crystalline material grows with a different crystal habit. In this application note, we describe Nano-Crystal, a novel web-based crystallographic tool, which creates nanoparticle models from any crystal structure guided by their preferred equilibrium shape under standard conditions according to the Wulff morphology (crystal habit). Users can upload a cif file, define the Miller indices and their corresponding minimum surface energies according to the Wulff construction of a particular crystal, and specify the size of the nanocrystal. As a result, the nanoparticle is constructed and visualized, and the coordinates of the atoms are output to the user. Nano-Crystal can be accessed and used at http://nanocrystal.vi-seem.eu/.</p
Membrane Composition and Raf[CRD]-Membrane Attachment Are Driving Forces for K-Ras4B Dimer Stability
Ras proteins are membrane-anchored GTPases that regulate key cellular signaling networks. It has been recently shown that different anionic lipid types can affect the properties of Ras in terms of dimerization/clustering on the cell membrane. To understand the effects of anionic lipids on key spatiotemporal properties of dimeric K-Ras4B, we perform all-atom molecular dynamics simulations of the dimer K-Ras4B in the presence and absence of Raf[RBD/CRD] effectors on two model anionic lipid membranes: one containing 78% mol DOPC, 20% mol DOPS, and 2% mol PIP2 and another one with enhanced concentration of anionic lipids containing 50% mol DOPC, 40% mol DOPS, and 10% mol PIP2. Analysis of our results unveils the orientational space of dimeric K-Ras4B and shows that the stability of the dimer is enhanced on the membrane containing a high concentration of anionic lipids in the absence of Raf effectors. This enhanced stability is also observed in the presence of Raf[RBD/CRD] effectors although it is not influenced by the concentration of anionic lipids in the membrane, but rather on the ability of Raf[CRD] to anchor to the membrane. We generate dominant K-Ras4B conformations by Markov state modeling and yield the population of states according to the K-Ras4B orientation on the membrane. For the membrane containing anionic lipids, we observe correlations between the diffusion of K-Ras4B and PIP2 and anchoring of anionic lipids to the Raf[CRD] domain. We conclude that the presence of effectors with the Raf[CRD] domain anchoring on the membrane as well as the membrane composition both influence the conformational stability of the K-Ras4B dimer, enabling the preservation of crucial interface interactions
A Perspective on the Prospective Use of AI in Protein Structure Prediction
AlphaFold2 (AF2) and RoseTTaFold (RF) have revolutionized structural biology, serving as highly reliable and effective methods for predicting protein structures. This article explores their impact and limitations, focusing on their integration into experimental pipelines and their application in diverse protein classes, including membrane proteins, intrinsically disordered proteins (IDPs), and oligomers.
In experimental pipelines, AF2 models aid X-ray crystallography in resolving the phase problem, while complementarity with Mass Spectrometry and NMR data enhances structure determination and protein flexibility prediction. Predicting the structure of membrane proteins remains challenging for both AF2 and RF due to difficulties in capturing conformational ensembles and interactions with the membrane. Improvements in incorporating membrane-specific features and predicting the structural effect of mutations are crucial. For Intrinsically Disordered Proteins, AF2's confidence score (pLDDT) serves as a competitive disorder predictor, but integrative approaches with molecular dynamics simulations or hydrophobic cluster analyses are advocated for accurate dynamics representation. AF2 and RF show promising results for oligomeric models, outperforming traditional docking methods, with AlphaFold-Multimer showing improved performance, however, somes caveats remain in particular for membrane proteins. Real-life examples demonstrate AF2's predictive capabilities in unknown protein structures, but models should be evaluated for their agreement with experimental data. Furthermore, combining AF2 models with molecular dynamics simulations can be used complementarily.
In this perspective we propose a "wish list" for improving deep learning-based protein folding prediction models, including using experimental data as constraints and modifying models with binding partners or post-translational modifications. Additionally, a meta-tool for ranking and suggesting composite models is suggested, driving future advancements in this rapidly evolving field
Perspective sur l'utilisation prospective de l'IA dans la prédiction de la structure protéique
International audienceAlphaFold2 (AF2) and RoseTTaFold (RF) have revolutionized structural biology, serving as highly reliable and effective methods for predicting protein structures. This article explores their impact and limitations, focusing on their integration into experimental pipelines and their application in diverse protein classes, including membrane proteins, intrinsically disordered proteins (IDPs), and oligomers.In experimental pipelines, AF2 models aid X-ray crystallography in resolving the phase problem, while complementarity with Mass Spectrometry and NMR data enhances structure determination and protein flexibility prediction. Predicting the structure of membrane proteins remains challenging for both AF2 and RF due to difficulties in capturing conformational ensembles and interactions with the membrane. Improvements in incorporating membrane-specific features and predicting the structural effect of mutations are crucial. For Intrinsically Disordered Proteins, AF2's confidence score (pLDDT) serves as a competitive disorder predictor, but integrative approaches with molecular dynamics simulations or hydrophobic cluster analyses are advocated for accurate dynamics representation. AF2 and RF show promising results for oligomeric models, outperforming traditional docking methods, with AlphaFold-Multimer showing improved performance, however, somes caveats remain in particular for membrane proteins. Real-life examples demonstrate AF2's predictive capabilities in unknown protein structures, but models should be evaluated for their agreement with experimental data. Furthermore, combining AF2 models with molecular dynamics simulations can be used complementarily. In this perspective we propose a "wish list" for improving deep learning-based protein folding prediction models, including using experimental data as constraints and modifying models with binding partners or post-translational modifications. Additionally, a meta-tool for ranking and suggesting composite models is suggested, driving future advancements in this rapidly evolving field.AlphaFold2 (AF2) et RoseTTaFold (RF) ont révolutionné la biologie structurale, servant de méthodes très fiables et efficaces pour prédire les structures protéiques. Cet article explore leur impact et leurs limites, en se concentrant sur leur intégration dans des pipelines expérimentaux et leur application dans diverses classes de protéines, y compris les protéines membranaires, les protéines intrinsèquement désordonnées (IDP) et les oligomères.Dans les pipelines expérimentaux, les modèles AF2 aident la cristallographie radiographique à résoudre le problème de phase, tandis que la complémentarité avec les données de spectrométrie de masse et RMN améliore la détermination de la structure et la prédiction de la flexibilité des protéines. Prédire la structure des protéines membranaires reste difficile pour AF2 et RF en raison de difficultés à capturer des ensembles conformationnels et des interactions avec la membrane. Des améliorations dans l'incorporation de caractéristiques spécifiques à la membrane et la prédiction de l'effet structurel des mutations sont cruciales. Pour les Protéines Intrinsèquement Désordonnées, le score de confiance d'AF2 (pLDDT) sert de prédicteur de désordre compétitif, mais des approches intégratives avec des simulations de dynamique moléculaire ou des analyses de cluster hydrophobes sont préconisées pour une représentation dynamique précise. AF2 et RF montrent des résultats prometteurs pour les modèles oligomériques, surpassant les méthodes d'amarrage traditionnelles, avec AlphaFold-Multimer montrant des performances améliorées, cependant, certaines mises en garde subsistent en particulier pour les protéines membranaires. Des exemples réels démontrent les capacités prédictives de l'AF2 dans des structures protéiques inconnues, mais les modèles devraient être évalués pour leur accord avec les données expérimentales. De plus, la combinaison de modèles AF2 avec des simulations de dynamique moléculaire peut être utilisée de manière complémentaire.Dans cette perspective, nous proposons une "liste de souhaits" pour améliorer les modèles de prédiction du repliement des protéines basés sur l'apprentissage profond, y compris l'utilisation de données expérimentales comme contraintes et la modification de modèles avec des partenaires de liaison ou des modifications post-traductionnelles. De plus, un méta-outil pour classer et suggérer des modèles composites est suggéré, ce qui conduira à de futures avancées dans ce domaine en évolution rapide