13 research outputs found
Hardware/Software Partitioning of Floating Point Software Applications to Fixed-Pointed Coprocessor Circuits
ABSTRACT General Terms Design, Performance. Keywords Hardware/software partitioning, floating point to fixed conversion, floating point, fixed point
Σχεδίαση Aρχιτεκτονικής SoC για τον FRM-SSA
Στην Ενότητα 2 παρουσιάζονται οι στοχαστικές μέθοδοι προσομοίωσης και αλγόριθμοι SSA και FRM-SSA του Gillespie.
Στην Ενότητα 3 παρουσιάζονται αναλυτικά οι προδιαγραφές του συστήματος που υλοποιήθηκε, ο βαθμός παραμετροποίησης του καθώς και οι τρόποι λειτουργίας του.
Στην Ενότητα 4 αναλύεται η αρχιτεκτονική FRM SoC σε επίπεδο συστήματος καθώς επίσης γίνεται και σύντομη αναφορά στο σύστημα επικοινωνίας υπολογιστή και συστήματος.
Στην Ενότητα 5 παρουσιάζεται η αρχιτεκτονική της επεξεργαστικής μονάδας (FRM Processing Unit - FPU) ενός SSA Core. Δίνεται έμφαση στη δίοδο δεδομένων της FPU ενώ περιγράφονται αναλυτικά και οι υπόλοιπες μονάδες που πλαισιώνουν τη δίοδο δεδομένων της FPU. Επιπλέον παρουσιάζεται και η θεωρητική μελέτη των επιδόσεων που έγινε κατά το σχεδιασμό.
Στην Ενότητα 6 παρουσιάζονται τα στατιστικά αποτελέσματα που προέκυψαν από τη σύνθεση του συστήματος για διάφορους τρόπους λειτουργίας.
Στην 7 και τελευταία ενότητα παρουσιάζονται πραγματικά αποτέλεσμα από δοκιμές του συστήματος με σκοπό την επικύρωση της σχεδίασης. Για αυτό το λόγο γίνεται σύγκριση των αποτελεσμάτων με τα αποτελέσματα γνωστών πλατφόρμων προσομοίωσης
Σχεδίαση Αρχιτεκτονικής SoC για τον NRM-SSA
Στο Παραδοτέο 1.1 έχει περιγραφεί η σχεδίαση και υλοποίηση συστήματος στοχαστικής προσομοίωσης
βασιζόμενο στον αλγόριθμο First Reaction Method (FRM) του Gillespie. Η παράλληλη και πολυπύρηνη
αρχιτεκτονική που ενσωματώνει, η δυνατότητα παραμετροποίησης των πυρήνων, καθώς και η άκρως
ικανοποιητική απόδοσή τους, ανέδειξαν τα πλεονεκτήματα και τη σπουδαιότητα της χρήσης υλικού ειδικού
σκοπού για εφαρμογές στοχαστικής προσομοίωσης βιολογικών δικτύων με τη χρήση FPGAs.
Το παρόν παραδοτέο επικεντρώνεται στην ανάπτυξη ενός ολοκληρωμένου υπολογιστικού συστήματος
στοχαστικής προσομοίωσης βασιζόμενο στον αλγόριθμο Next Reaction Method (NRM) των Gibson και Bruck
[17]. Σκοπός μας ήταν να επαναχρησιμοποιήσουμε μέρος του συστήματος που έχει ήδη σχεδιαστεί για τον
FRM–SSA, ώστε να ελαχιστοποιηθεί ο χρόνος σχεδίασης, και να οδηγηθούμε σε μια αποδοτική λύση
εφαρμόζοντας τεχνικές πλήρους σωλήνωσης (pipeline), παράλληλης επεξεργασίας (parallel processing) και
απόκρυψης της καθυστέρησης (latency hiding) σε επίπεδο υλικού.
Εν τέλει, μετά την ολοκλήρωση και την επικύρωση των δύο συστημάτων, σκοπεύουμε να συγκρίνουμε τις δύο
αρχιτεκτονικές υλοποιήσεις τόσο ως προς την αποδοτικότητα, επιδόσεις και απαιτήσεις υλικού, όσο και ως προς τον βαθμό στατιστικής ομοιότητας που παρουσιάζουν τα αποτελέσματά τους εκτελώντας τα ίδια
πειράματα κάτω από τις ίδιες συνθήκες (Παραδοτέο 1.3)
Σχεδίαση και FPGA υλοποίηση συστήματος σε ψηφίδα για στοχαστική προσομοίωση πολύπλοκων βιομοριακών δικτύων με χρήση του NRM-SSA
Η στοχαστική προσομοίωση μεγάλης κλίμακας δικτύων βιομοριακών αλληλεπιδράσεων,
με χιλιάδες αντιδράσεις και μοριακά είδη, αποτελεί σημαντικό εργαλείο για τη
Συστημική Βιολογία και τη Συστημική Ιατρική, που θα επιτρέψει τον πειραματισμό
in-silico με βιομοριακά δίκτυα κλίμακας κυττάρου ή/και κυτταρικών πληθυσμών.
Παρουσιάζουμε τη σχεδίαση και υλοποίηση διαμορφώσιμου παραμετρικού συστήματος
σε ψηφίδα (System-on-Chip, SoC) υψηλής απόδοσης, για την επιτάχυνση του
αλγορίθμου Next Reaction Method των Gibson και Bruck, σε υλικό
επαναπρογραμματιζόμενης λογικής (FPGA). Το σύστημά μας χρησιμοποιεί επιθετική
διοχέτευση (pipelining) στο επίπεδο του πυρήνα (core) και συνδυάζει πολλούς
πυρήνες σε δίκτυο αστέρα, ικανούς να εκτελούν παράλληλα και αποδοτικά
επαναλήψεις στοχαστικής προσομοίωσης βιομοντέλων με έως και 4Κ αντιδράσεις 3ης
τάξης. Με τη σχεδίαση που επιλέξαμε, η απόδοση του πυρήνα NRM εξαρτάται μόνο
από το μέσο όρο των επηρεαζόμενων αντιδράσεων και όχι από το πλήθος των
αντιδράσεων του μοντέλου. Καθώς αυξάνεται το πλήθος των πυρήνων, η απόδοσή του
SoC κλιμακώνεται γραμμικά και φτάνει σε επίπεδο GCycles/sec. Συνεπώς με ένα
μεσαίου μεγέθους FPGA και συχνότητα λειτουργίας ~200 MHz το σύστημά μας
αποφέρει πολύ υψηλές επιδόσεις σε σχέση με δημοφιλείς προσομοιωτές λογισμικού
που τρέχουν σε ένα ισχυρό υπολογιστικό σύστημα. Αποτελεί δε το γρηγορότερο
σύστημα στη διεθνή βιβλιογραφία για στοχαστικές προσομοιώσεις βιολογικών
δικτύων με τον δημοφιλή NRM-SSA.Stochastic simulation of large-scale biochemical reaction networks, with
thousands of reactions, is an important tool for systems biology and systems
medicine, since it enables the in-silico experimentation with genome-scale
reconstructed networks. FPGA-based accelerators can exploit parallelism, but
have been limited on the size of biomodels they can handle effectively. In this
graduate thesis, we present the design and implementation of a high performance
scalable System-on-Chip architecture for implementing Gibson and Bruck's Next
Reaction Method in reconfigurable hardware. Our MPSoC uses aggressive
pipelining at the core level and combines many cores into a star configuration
Network-on-Chip to execute in parallel stochastic repetitions of complex
biomodels, each one with up to 4K reactions. The performance of our NRM core
depends only on the average number of dependent reactions (outdegree of the
biomodel's Dependencies Graph - DG) and not on the number of reactions (DG
nodes). By adding cores to the NoC, the system's performance scales linearly
and reaches GCycles/sec levels. We show that a medium size FPGA running at ~200
MHz delivers high speedup relative to popular and efficient software simulators
running on a very powerful workstation. This is currently the fastest hardware
accelerator available in the literature for the NRM-SSA
Reconfigurable Hardware Acceleration of Exact Stochastic Simulation
This thesis explores the use of reconfigurable hardware in modeling chemical species reacting in a spatially homogeneous environment. The time evolution of biochemical models is often evaluated using a deterministic approach that uses differential equations to describe the chemical interactions of the model. However, such an approach treats species as continuous valued concentrations, is inaccurate for small species populations, and neglects the stochastic nature of biochemical systems. The Stochastic Simulation Algorithm (SSA) developed by Gillespie is able to properly account for these inherent noise fluctuations. This allows the SSA to accurately project the time evolution of a biochemical model. Unfortunately, the SSA can be computationally intensive and require a substantial amount of time to complete.
Therefore, it has been proposed that the SSA be implemented on a Field Programmable Gate Array (FPGA) to improve performance. Employing an FPGA allows parallelism to be exploited within the SSA providing a speedup over software implementations executing instructions sequentially. Recent work in this area has focused on implementing the SSA on an FPGA to simulate specific biochemical models. However, this requires re-constructing and re-synthesizing the design in order to simulate a new biochemical system. This work examines the use of a reconfigurable computing platform to allow an implementation of the SSA on an FPGA to simulate a variety of models. The designs presented herein demonstrate a speedup of roughly 1.5X
Σχεδίαση και FPGA Υλοποίηση IP πυρήνων και SoCs για Παράλληλη Στοχαστική Προσομοίωση Βιολογικών Δικτύων
Η προσομοίωση ολόκληρου του κυττάρου αποτελεί μια από τις μεγαλύτερες
προκλήσεις του 21ου αιώνα. Σε κυτταρικό επίπεδο ένα βιοχημικό σύστημα μπορεί να
περιγράφεται από χιλιάδες αντιδράσεις όπου συμμετέχουν αλληλοεπιδρώντα μοριακά
είδη. Ωστόσο τα σημερινά υπολογιστικά συστήματα αδυνατούν να διαχειριστούν
αποδοτικά βιομοντέλα τέτοιας πολυπλοκότητας. Το αντικείμενο της παρούσας
διπλωματικής εργασίας είναι η σχεδίαση και ανάπτυξη ενός ενσωματωμένου
υπολογιστικού συστήματος το οποίο θα μπορεί να χρησιμοποιηθεί για τη στοχαστική
προσομοίωση βιομοντέλων χιλιάδων αντιδράσεων. Μέσω VHDL περιγραφών υλοποιήσαμε
με FPGAs μια ευέλικτη πολυπύρηνη αρχιτεκτονική που στόχο έχει την παράλληλη
εκτέλεση στοχαστικών προσομοιώσεων χρησιμοποιώντας τον αλγόριθμο του Gillespie,
First Reaction Method. Η αρχιτεκτονική που αναπτύχθηκε έχει την μορφή "μαλακού
πυρήνα" (soft IP core) και είναι πλήρως παραμετρική ως προς τα χαρακτηριστικά
του βιομοντέλου αλλά και ως προς τη δέσμευση πόρων υλικού. Χρησιμοποιεί έναν
υπολογιστή γενικού σκοπού για την επικοινωνία του χρήστη και υποστηρίζει
προσομοιώσεις βιομοντέλων με έως 4Κ αντιδράσεις σε ένα μετρίου μεγέθους FPGA.
Τέλος αποδεικνύεται ότι το σύστημα που αναπτύχθηκε λειτουργώντας στη συχνότητα
των 220 MHz μπορεί να επιταχύνει την διαδικασία της προσομοίωσης έως και 17.6
φορές σε σύγκριση με τη σειριακή εκτέλεση του αλγορίθμου από δημοφιλή
προγράμματα προσομοίωσης βιοχημικών δικτύων όπως το COPASI.Whole cell simulation is one of the greatest challenges of the 21st century. A
biochemical system at the cellular level may involve thousands of reaction
channels and molecular species. However at present, computational tools are
unable to handle efficiently the simulation of biomodels of such a high
complexity. In this thesis we designed and developed a System-on-Chip to
simulate efficiently and stochastically biomodels with practically any number
of reaction channels given an appropriate size FPGA. Using parametric VHDL
descriptions we realized a flexible multicore architecture to perform in
parallel stochastic simulations based on Gillespie’s First Reaction Method. Our
MPSoC architecture is captured as a soft IP core that is fully parametric in
terms of biomodel’s characteristics and hardware resources and serves as an
accelerator to a general purpose PC, the front-end for user interaction. It
supports the stochastic simulation of biochemical reaction networks with up to
4K reaction channels and molecular species using a medium-size FPGA. It is
shown that the system when operating at 220 MHz can accelerate simulation by a
factor of 17.6 compared to well-known serial software simulator COPASI running
on a very fast compute server
Υλοποίηση συστημάτων σε ψηφίδα(SoC) για τη στοαχαστική προσμοίωση μεγάλων δικτύων βιοχημικών αντιδράσεων
 Η παρούσα Διπλωματική Εργασία, αφορά την υλοποίηση ενός ψηφιακού
συστήματος (SoC) ειδικού σκοπού με στόχο την στοχαστική προσομοίωση μεγάλων
δικτύων βιοχημικών αντιδράσεων με FPGAs της Xilinx και της Altera. Προτείνονται
σχεδιάσεις μικροϋπολογιστών συστημάτων για τη παράλληλη επεξεργασία των
αλγορίθμων προσομοίωσης αλλά και την παράλληλη εκτέλεση ανεξάρτητων
προσομοιώσεων στο ίδιο σύστημα. Για τον λόγο αυτό κατασκευάσαμε SoCs με μέχρι 8
παράλληλα επεξεργαστικά στοιχεία τα οποία έχουν τη δυνατότητα να εκτελούν
παράλληλα δύο από τους πιο γνωστούς αλγορίθμους στοχαστικής προσομοίωσης, τον
Gillespie SSA First Reaction Method και τον SSA Next Reaction Method. Τα SoCs
που σχεδιάστηκαν μπορούν να προσομοιώσουν δίκτυα με μέχρι 16Κ χημικές
αντιδράσεις που η κάθε μια μπορεί να είναι μέχρι και 3ης τάξης. Η συχνότητα
λειτουργίας στα FPGA ανέρχεται στα 266-320 MHz με εσωτερικές τις καθυστερήσεις
να κυμαίνονται από 55-85 κύκλους ανά χημική αντίδραση. Επιπροσθέτως έγινε
μελέτη για την διεπαφή του ψηφιακού συστήματος με τον μικροεπεξεργαστή LEON
και χρήση του προγράμματος SysPy για τη δημιουργία ενός εργαλείου επικοινωνίας
με το χρήστη, με στόχο την αυτοματοποίηση των λειτουργιών της σύνθεσης του
ψηφιακού συστήματος, αναλόγως των απαιτήσεων του βιοχημικού μοντέλου που
προσομοιώνεται, αλλά και τη μεταφορά των αποτελεσμάτων της προσομοίωσης στον
Η/Υ. This thesis presents the design of scalable reconfigurable parametric Systems
on Chip (SoC) that implement Gillespie’s Stochastic Simulation Algorithms
(SSA), namely the First Reaction Method and Gibson and Bruck’s Next Reaction
Method. We have proved that our architectures of scalable SoCs can deliver
performance (Mega reactions/sec) which is increasing linearly with the
number of parallel processors, when simulating bimolecular networks with
up to 16Κ reactions in a single FPGA. This is important because it
contributes to systems biology by enabling realistic simulation of increasingly
larger reaction networks (e.g. large metabolic networks or whole species
reaction networks). In order to do so, we have designed and verified
various scalable parametric FRM/NRM SoC architectures with N=1,2,4
Processing Elements (PEs) for Xilinx Virtex 5 and Virtex 7 FPGAs,
reaching clock frequencies as high as 320 MHz and delivering throughput
as high as 3.1 Mega Reaction cycles/sec. A new approach is also presented which
can simulate biochemical reaction networks of different reaction orders with
multiple products. Using it we are able to perform either one parallel
simulation of a reaction network in parallel, or N different independent
simulations of reaction networks within the same SoC with N PEs, for both SSA
algorithms (FRM, NRM)