Σχεδίαση και FPGA υλοποίηση συστήματος σε ψηφίδα για στοχαστική προσομοίωση πολύπλοκων βιομοριακών δικτύων με χρήση του NRM-SSA

Abstract

Η στοχαστική προσομοίωση μεγάλης κλίμακας δικτύων βιομοριακών αλληλεπιδράσεων, με χιλιάδες αντιδράσεις και μοριακά είδη, αποτελεί σημαντικό εργαλείο για τη Συστημική Βιολογία και τη Συστημική Ιατρική, που θα επιτρέψει τον πειραματισμό in-silico με βιομοριακά δίκτυα κλίμακας κυττάρου ή/και κυτταρικών πληθυσμών. Παρουσιάζουμε τη σχεδίαση και υλοποίηση διαμορφώσιμου παραμετρικού συστήματος σε ψηφίδα (System-on-Chip, SoC) υψηλής απόδοσης, για την επιτάχυνση του αλγορίθμου Next Reaction Method των Gibson και Bruck, σε υλικό επαναπρογραμματιζόμενης λογικής (FPGA). Το σύστημά μας χρησιμοποιεί επιθετική διοχέτευση (pipelining) στο επίπεδο του πυρήνα (core) και συνδυάζει πολλούς πυρήνες σε δίκτυο αστέρα, ικανούς να εκτελούν παράλληλα και αποδοτικά επαναλήψεις στοχαστικής προσομοίωσης βιομοντέλων με έως και 4Κ αντιδράσεις 3ης τάξης. Με τη σχεδίαση που επιλέξαμε, η απόδοση του πυρήνα NRM εξαρτάται μόνο από το μέσο όρο των επηρεαζόμενων αντιδράσεων και όχι από το πλήθος των αντιδράσεων του μοντέλου. Καθώς αυξάνεται το πλήθος των πυρήνων, η απόδοσή του SoC κλιμακώνεται γραμμικά και φτάνει σε επίπεδο GCycles/sec. Συνεπώς με ένα μεσαίου μεγέθους FPGA και συχνότητα λειτουργίας ~200 MHz το σύστημά μας αποφέρει πολύ υψηλές επιδόσεις σε σχέση με δημοφιλείς προσομοιωτές λογισμικού που τρέχουν σε ένα ισχυρό υπολογιστικό σύστημα. Αποτελεί δε το γρηγορότερο σύστημα στη διεθνή βιβλιογραφία για στοχαστικές προσομοιώσεις βιολογικών δικτύων με τον δημοφιλή NRM-SSA.Stochastic simulation of large-scale biochemical reaction networks, with thousands of reactions, is an important tool for systems biology and systems medicine, since it enables the in-silico experimentation with genome-scale reconstructed networks. FPGA-based accelerators can exploit parallelism, but have been limited on the size of biomodels they can handle effectively. In this graduate thesis, we present the design and implementation of a high performance scalable System-on-Chip architecture for implementing Gibson and Bruck's Next Reaction Method in reconfigurable hardware. Our MPSoC uses aggressive pipelining at the core level and combines many cores into a star configuration Network-on-Chip to execute in parallel stochastic repetitions of complex biomodels, each one with up to 4K reactions. The performance of our NRM core depends only on the average number of dependent reactions (outdegree of the biomodel's Dependencies Graph - DG) and not on the number of reactions (DG nodes). By adding cores to the NoC, the system's performance scales linearly and reaches GCycles/sec levels. We show that a medium size FPGA running at ~200 MHz delivers high speedup relative to popular and efficient software simulators running on a very powerful workstation. This is currently the fastest hardware accelerator available in the literature for the NRM-SSA

    Similar works