18 research outputs found

    SHREC2020 track:Multi-domain protein shape retrieval challenge

    Get PDF
    Proteins are natural modular objects usually composed of several domains, each domain bearing a specific function that is mediated through its surface, which is accessible to vicinal molecules. This draws attention to an understudied characteristic of protein structures: surface, that is mostly unexploited by protein structure comparison methods. In the present work, we evaluated the performance of six shape comparison methods, among which three are based on machine learning, to distinguish between 588 multi-domain proteins and to recreate the evolutionary relationships at the proteinand species levels of the SCOPe database. The six groups that participated in the challenge submitted a total of 15 sets of results. We observed that the performance of all the methods significantly decreases at the species level, suggesting that shape-only protein comparison is challenging for closely related proteins. Even if the dataset is limited in size (only 588 proteins are considered whereas more than 160,000 protein structures are experimentally solved), we think that this work provides useful insights into the current shape comparison methods performance, and highlights possible limitations to large-scale applications due to the computational cost

    I-SEARCH - a multimodal search engine based on rich unified content description (RUCoD)

    Get PDF
    International audienceIn this paper, we report on work around the I-SEARCH EU (FP7 ICT STREP) project whose objective is the development of a multimodal search engine. We present the project's objectives, and detail the achieved results, amongswhich a Rich Unified Content Description format

    One size does not fit all - multimodal search on mobile and desktop devices with the I-SEARCH search engine

    Get PDF
    International audienceIn this paper, we report on work around the I-SEARCH EU (FP7 ICT STREP) project whose objective is the development of a multimodal search engine targeted at mobile and desktop devices. Each of these device classes has its speci c hardware capabilities and set of supported features. In order to provide a common multimodal search experience across device classes, one size does not t all. We highlight ways to achieve the same functionality agnostic of the device class being used for the search, and present concrete use cases

    SHREC 2018 - Protein Shape Retrieval

    Get PDF
    Proteins are macromolecules central to biological processes that display a dynamic and complex surface. They display multiple conformations differing by local (residue side-chain) or global (loop or domain) structural changes which can impact drastically their global and local shape. Since the structure of proteins is linked to their function and the disruption of their interactions can lead to a disease state, it is of major importance to characterize their shape. In the present work, we report the performance in enrichment of six shape-retrieval methods (3D-FusionNet, GSGW, HAPT, DEM, SIWKS and WKS) on a 2 267 protein structures dataset generated for this protein shape retrieval track of SHREC’18

    Μέθοδοι ανάλυσης τρισδιάστατων σχημάτων για αναζήτηση ομοιότητας πρωτεϊνών και protein docking

    No full text
    Protein functions are carried out through their interactions with other biological molecules. Research in protein interactions has attracted special interest from the scientific community for decades and still remains a hot research topic. Among others, there is an increasing interest to develop computational methods that automatically predict the 3D structure of protein-protein complexes, such as protein-protein docking. In this thesis, we propose novel approaches to assist protein-protein docking and protein similarity search. The proposed methods are based on the fact that when two proteins interact, their surfaces at the binding site demonstrate geometric complementarity (apart from physicochemical complementarity). The first docking method is based on geometric complementarity matching of the molecular surfaces. The basic idea of this algorithm is to use a descriptor that measures 3D shape similarity for computing shape complementarity, since equally-sized complementary surface patches tend to have similar shapes. A basic property of the proposed shape descriptor is its invariance to rotations of the surface patches. Complementarity matching is achieved through pairwise comparison of the local shape descriptors, thus, providing a fast geometric filtering and avoiding the exhaustive translational and rotational search of existing docking techniques.The second docking method extends this work in order to produce a docking algorithm that is robust to relatively small conformational changes of the interacting proteins. Since accurate surface complementarity has been proven to be inappropriate in unbound docking, the new method allows binding of surfaces with approximate surface complementarity. Experiments proved that the improved algorithm is more robust to conformational changes. Furthermore, a new scoring function is presented, which combines geometric complementarity with physicochemical factors, such as Coulomb potentials, van der Waals forces, hydrophobicity. The scoring function takes as input the list of candidate poses and a new rank list is produced having more near-native poses in the first positions. The last method that is proposed in this dissertation is an approach for molecular shape comparison. It aims to assist the problem of virtual screening, a process that is commonly used in rational drug design. More specifically, a new shape descriptor is proposed that combines local, global and hybrid local-global shape features. It is experimentally proven that the proposed compound descriptor is appropriate for similarity search of flexible ligands, while at the same time is robust in shape comparison of rigid proteins. Due to its compactness, the new descriptor enables fast screening of similar ligands to a target molecule from very large compound databases.Οι λειτουργίες των πρωτεϊνών πραγματοποιούνται κυρίως μέσω των αλληλεπιδράσεών τους με άλλα μόρια. Η έρευνα στο πεδίο των αλλλεπιδράσεων των πρωτεϊνών έχει προσελκύσει το ενδιαφέρον των επιστημόνων εδώ και δεκαετίες και εξακολουθεί να παραμένει ένα από τα σημαντικότερα προβλήματα στο χώρο της βιολογίας. Μεταξύ άλλων, το ενδιαφέρον στρέφεται στην ανάπτυξη υπολογιστικών μεθόδων ικανών να προβλέψουν με αυτόματο τρόπο την τρισδιάστατη δομή των συμπλόκων μορίων πρωτεϊνών, όπως το “Protein Docking”. Στην παρούσα διατριβή, προτείνονται καινοτόμες μέθοδοι για την υποβοήθηση των διαδικασιών του protein docking και της αναζήτησης πρωτεϊνικών δομών. Οι προτεινόμενες μέθοδοι βασίζονται στην ιδέα ότι όταν δυο πρωτεΐνες αλληλεπιδρούν οι επιφάνειές τους στην περιοχή σύνδεσης πρέπει να παρουσιάζουν γεωμετρική συμπληρωματικότητα (εκτός από τη φυσικοχημική συμπληρωματικότητα).Η πρώτη μέθοδος για protein docking βασίζεται στο ταίριασμα γεωμετρικά συμπληρωματικών επιφανειών. Η βασική ιδέα του αλγορίθμου είναι η χρήση ενός περιγραφέα (descriptor) που υπολογίζει ομοιότητα τρισδιάστατων σχημάτων (3D shape similarity) για τον υπολογισμό γεωμετρικής συμπληρωματικότητας, δεδομένου ότι ισομεγέθη συμπληρωματικά τμήματα επιφανειών τείνουν να έχουν παρόμοιο σχήμα. Μια σημαντική ιδιότητα του προτεινόμενου περιγραφέα είναι η αμεταβλητότητά του κατά την περιστροφή των επιφανειακών τμημάτων. Το ταίριασμα των συμπληρωματικών τμημάτων πραγματοποιείται με σύγκριση κατά ζεύγη των αντίστοιχων περιγραφέων, παρέχοντας έτσι ένα γρήγορο γεωμετρικό φιλτράρισμα. Με τον τρόπο αυτό, αποφεύγονται οι εξαντλητικές μετατοπίσεις και περιστροφές και επιταχύνεται η διαδικασία του docking.Η δεύτερη μέθοδος αποτελεί επέκταση της προηγούμενης με στόχο τη δημιουργία αλγορίθμου για docking που παρέχει μεγαλύτερη σταθερότητα όταν οι πρωτεΐνες παρουσιάζουν σχετική ευκαμψία (flexibility). Η περίπτωση του “unbound docking”, όπως αλλιώς λέγεται, απαιτεί οι δυο επιφάνειες να παρουσιάζουν “κατά προσέγγιση” συμπληρωματικότητα, παρά “ακριβή” συμπληρωματικότητα όπως συμβαίνει στην περίπτωση του “bound docking”. Πειραματικά αποτελέσματα απέδειξαν ότι ο βελτιωμένος αλγόριθμος είναι πιο εύρωστος στα θέματα ευξαμψίας των πρωτεϊνών. Επιπλέον, παρουσίαζεται μια νέα συνάρτηση βαθμολόγησης (scoring function), η οποία συνδυάζει γεωμετρική συμπληρωματικότητα με φυσικοχημικούς παράγοντες, όπως δυναμικά Coulomb, δυνάμεις van der Waals, υδροφοβικότητα. Η συνάρτηση δέχεται ως είσοδο τη λίστα με τις υποψήφιες θέσεις (πιθανά σύμπλοκα) και παράγει μια νέα κατάταξη όπου τα σωστά σύμπλοκα εμφανίζονται συχνότερα στις πρώτες θέσεις.Η τελευταία μέθοδος είναι μια προσέγγιση για σύγκριση ομοιότητας τρισδιάστατων πρωτεϊνικών δομών. Μια από τις πιθανές εφαρμογές της είναι στο πρόβλημα του “virtual screening”, της αναζήτησης όμοιων προσδετών (ligands) μέσα από βάσεις μορίων, με στόχο το σχεδιασμό φαρμάκων. Πιο συγκεκριμένα, ένας νέος περιγραφέας σχήματος προτείνεται, ο οποίος συνδιάζει τοπικά (local), καθολικά (global) και υβριδικά (local-global) χαρακτηριστικά σχήματος. Πειραματικά αποτελέσματα αποδεικνύουν ότι ο προτεινόμενος περιγραφέας είναι κατάλληλος για αναζήτηση ομοιότητας ακόμα και όταν τα μόρια-προσδέτες παρουσιάζουν σχετική ευκαμψία. Παράλληλα, είναι εξίσου αποτελεσματικός στην αναζήτηση ομοιότητας άκαμπτων (rigid) πρωτεϊνών. Λόγο του μικρού του μεγέθους (compactness), ο νέος περιγραφέας είναι κατάλληλος για γρήγορη αναζήτηση όμοιων μορίων ακόμα και από πολύ μεγάλες βάσεις

    3D Model Search and Retrieval Using the Spherical Trace Transform

    Get PDF
    This paper presents a novel methodology for content-based search and retrieval of 3D objects. After proper positioning of the 3D objects using translation and scaling, a set of functionals is applied to the 3D model producing a new domain of concentric spheres. In this new domain, a new set of functionals is applied, resulting in a descriptor vector which is completely rotation invariant and thus suitable for 3D model matching. Further, weights are assigned to each descriptor, so as to significantly improve the retrieval results. Experiments on two different databases of 3D objects are performed so as to evaluate the proposed method in comparison with those most commonly cited in the literature. The experimental results show that the proposed method is superior in terms of precision versus recall and can be used for 3D model search and retrieval in a highly efficient manner

    3D Model Search and Retrieval Using the Spherical Trace Transform

    No full text
    This paper presents a novel methodology for content-based search and retrieval of 3D objects. After proper positioning of the 3D objects using translation and scaling, a set of functionals is applied to the 3D model producing a new domain of concentric spheres. In this new domain, a new set of functionals is applied, resulting in a descriptor vector which is completely rotation invariant and thus suitable for 3D model matching. Further, weights are assigned to each descriptor, so as to significantly improve the retrieval results. Experiments on two different databases of 3D objects are performed so as to evaluate the proposed method in comparison with those most commonly cited in the literature. The experimental results show that the proposed method is superior in terms of precision versus recall and can be used for 3D model search and retrieval in a highly efficient manner.</p
    corecore