5 research outputs found

    Efficient Multicriteria Protein Structure Comparison on Modern Processor Architectures

    Get PDF

    Efficient algorithms and architectures for protein 3-D structure comparison

    Get PDF
    Η σύγκριση δομών πρωτεϊνών είναι ανεπτυγμένος τομέας της υπολογιστικής πρωτεϊνωμικής που χρησιμοποιείται ευρέως στη δομική βιολογία και την ανακάλυψη φαρμάκων. Οι αυξανόμενες υπολογιστικές απαιτήσεις του είναι αποτέλεσμα τριών παραγόντων: ταχεία επέκταση των βάσεων δεδομένων με νέες δομές πρωτεϊνών, υψηλή υπολογιστική πολυπλοκότητα των αλγορίθμων σύγκρισης δομών πρωτεϊνών κατά ζεύγη (PSC), και τάση χρήσης πολλαπλών μεθόδων σύγκρισης και συνδυασμού των αποτελεσμάτων τους (multi criteria protein structure comparison-MCPSC-), μιας και δεν υπάρχει PSC μέθοδος κοινά αποδεκτή ως η καλύτερη. Αναπτύξαμε πλαίσιο λογισμικού που εκμεταλλεύεται επεξεργαστές πολλών πυρήνων για την υλοποίηση παράλληλων στρατηγικών MCPSC με βάση τρεις δημοφιλείς PSC μεθόδους, τις TMalign, CE και USM. Συγκρίνουμε την απόδοση και αποδοτικότητα δύο παράλληλων υλοποιήσεων MCPSC στον πειραματικό επεξεργαστή δικτύου σε ψηφίδα (Network on Chip)  Intel Single-Chip Cloud Computer και τον δημοφιλή επεξεργαστή Intel Core i7. Επιπλέον, αναπτύξαμε εκτενές υπολογιστικό pipeline και υλοποίησή του με πρόγραμμα Python, που ονομάζεται pyMCPSC, που επιτρέπει στους χρήστες να εκτελούν MCPSC διεργασίες σε επεξεργαστές πολλαπλών πυρήνων. Το pyMCPSC, το οποίο συνδυάζει πέντε μεθόδους PSC και υποστηρίζει πέντε διαφορετικά σχήματα συναίνεσης MCPSC, υποστηρίζει τη συγκριτική ανάλυση μεγάλων συνόλων με δομές πρωτεϊνών και μπορεί να επεκταθεί ώστε να ενσωματώσει και νέες μεθόδους PSC στις βαθμολογίες συναίνεσης, καθώς αυτές καθίστανται διαθέσιμες.Protein Structure Comparison (PSC) is a well developed field of computational proteomics with active interest since it is widely used in structural biology and drug discovery. Fast increasing computational demand for all-to-all protein structures comparison is a result of mainly three factors: rapidly expanding structural proteomics databases, high computational complexity of pairwise PSC algorithms, and the trend towards using multiple criteria for comparison and combining their results (MCPSC). In this thesis we have developed a software framework that exploits many-core and multi-core CPUs to implement efficient parallel MCPSC schemes in modern processors based on three popular PSC methods, namely, TMalign, CE, and USM. We evaluate and compare the performance and efficiency of two parallel MCPSC implementations using Intel’s experimental many-core Single-Chip Cloud Computer (SCC) CPU as well as Intel’s Core i7 multi-core processor. Further, we have developed a dataset processing pipeline and implemented it in a Python utility, called pyMCPSC, allowing users to perform MCPSC efficiently on multi-core CPU. pyMCPSC, which combines five PSC methods and five different consensus scoring schemes, facilitates the analysis of similarities in protein domain datasets and can be easily extended to incorporate more PSC methods in the consensus scoring as they are becoming available

    Many-Core CPUs Can Deliver Scalable Performance to Stochastic Simulations of Large-Scale Biochemical Reaction Networks

    Get PDF
    Stochastic simulation of large-scale biochemical reaction networks is becoming essential for Systems Biology. It enables the in-silico investigation of complex biological system dynamics under different conditions and intervention strategies, while also taking into account the inherent "biological noise" especially present in the low species count regime. It is however a great computational challenge since in practice we need to execute many repetitions of a complex simulation model to assess the average and extreme cases behavior of the dynamical system it represents. The problem's work scales quickly, with the number of repetitions required and the number of reactions in the bio-model. The worst case scenario s when there is a need to run thousands of repetitions of a complex model with thousands of reactions. We have developed a stochastic simulation software framework for many- and multi-core CPUs. It is evaluated using Intel's experimental many-cores Single-chip Cloud Computer (SCC) CPU and the latest generation consumer grade Core i7 multi-core Intel CPU, when running Gillespie's First Reaction Method exact stochastic simulation algorithm. It is shown that emerging many-core NoC processors can provide scalable performance achieving linear speedup as simulation work scales in both dimensions

    Απεικόνιση Αλγορίθμων Στοχαστικής Προσομοίωσης σε Πολυ-Πύρηνη Αρχιτεκτονική NoC

    Get PDF
    Σε αυτή τη Τεχνική Αναφορά παρουσιάζουμε τη σχεδίαση ενός πλήρως παραμετροποιημένου πλαισίου λογισμικού προσομοίωσης (simulation framework) που μπορεί εύκολα να προσαρμοστεί και να παράξει παράλληλο λογισμικό τύπου SPMD (single processor multiple data) για στοχαστικές προσομοιώσεις σε ποικιλία υποκείμενων many-core αλλά και multi-core επεξεργαστών. Πρώτος μας στόχος ήταν η υλοποίηση και δοκιμή παράλληλου λογισμικού στην επεξεργαστική μονάδα Single-chip Cloud Computer (SCC) της Intel [13] μια πειραματική CPU με 48 πυρήνες διατεταγμένους σε δίκτυο τύπου πλέγματος (mesh-type Network On Chip). Ο επεξεργαστής SCC παρέχεται από τα Intel Labs στην επιστημονική κοινότητα ως ένα σύστημα για έρευνα και μελέτη της αναμενόμενης συμπεριφοράς του υλικού και του λογισμικού των νέων many-core CPUs τύπου NoC, με δεκάδες πυρήνες. Επιλέξαμε αυτή τη CPU ως πρώτο στόχο για το λογισμικό μας λόγω της μαζικά παράλληλης αρχιτεκτονικής της, που σε αντίθεση με τα FPGAs και τα GPUs, μπορεί να αξιοποιηθεί χρησιμοποιώντας ευρέως καθιερωμένα μοντέλα και τεχνικές παράλληλου προγραμματισμού. Χρησιμοποιήσαμε το πλαίσιο που αναπτύξαμε για να παραλληλοποιήσουμε τους δημοφιλείς αλγόριθμους FRM-SSA και NRM-SSA έτσι ώστε να μπορεί να εκτελεστεί αποδοτικά στην Intel SCC CPU. Αποδείξαμε ότι σημαντική επιτάχυνση (speedup) μπορεί να επιτευχθεί με αποδοτική χρήση των πολλαπλών πυρήνων που διαθέτει αυτός ο many-cores επεξεργαστής. Aπ'όσο είμαστε σε θέση να γνωρίζουμε, αυτή είναι η πρώτη παράλληλη υλοποίηση SSA αλγορίθμων για επεξεργαστές αρχιτεκτονικής NoC many-cores στη βιβλιογραφία. Η επεκτασιμότητα που παρέχει η αύξηση των πυρήνων μπορεί να καταστήσει τη λύση του παράλληλου λογισμικού ανταγωνιστική σε σχέση με τις λιγότερο ευέλικτες υλοποιήσεις υλικού ειδικού σκοπού, με βάση τα FPGAs και τα GPUs. Επιπλέον, το λογισμικό μας μπορεί εύκολα να επεκταθεί και να συμπεριλάβει και άλλους αλγόριθμους SSA αλλά και να στοχεύσει και σε άλλες αρχιτεκτονικές, όπως π.χ. οι πολυπήρινοι επεξεργαστές κοινόχρηστης μνήμης (shared memory multi-core CPUs), όπως π.χ. ο δημοφιλής Intel core i7 κ. α
    corecore