13 research outputs found

    Hardware/Software Partitioning of Floating Point Software Applications to Fixed-Pointed Coprocessor Circuits

    Get PDF
    ABSTRACT General Terms Design, Performance. Keywords Hardware/software partitioning, floating point to fixed conversion, floating point, fixed point

    Non-intrusive dynamic application profiler for detailed loop execution characterization

    Full text link

    Σχεδίαση Aρχιτεκτονικής SoC για τον FRM-SSA

    Get PDF
    Στην Ενότητα 2 παρουσιάζονται οι στοχαστικές μέθοδοι προσομοίωσης και αλγόριθμοι SSA και FRM-SSA του Gillespie. Στην Ενότητα 3 παρουσιάζονται αναλυτικά οι προδιαγραφές του συστήματος που υλοποιήθηκε, ο βαθμός παραμετροποίησης του καθώς και οι τρόποι λειτουργίας του. Στην Ενότητα 4 αναλύεται η αρχιτεκτονική FRM SoC σε επίπεδο συστήματος καθώς επίσης γίνεται και σύντομη αναφορά στο σύστημα επικοινωνίας υπολογιστή και συστήματος. Στην Ενότητα 5 παρουσιάζεται η αρχιτεκτονική της επεξεργαστικής μονάδας (FRM Processing Unit - FPU) ενός SSA Core. Δίνεται έμφαση στη δίοδο δεδομένων της FPU ενώ περιγράφονται αναλυτικά και οι υπόλοιπες μονάδες που πλαισιώνουν τη δίοδο δεδομένων της FPU. Επιπλέον παρουσιάζεται και η θεωρητική μελέτη των επιδόσεων που έγινε κατά το σχεδιασμό. Στην Ενότητα 6 παρουσιάζονται τα στατιστικά αποτελέσματα που προέκυψαν από τη σύνθεση του συστήματος για διάφορους τρόπους λειτουργίας. Στην 7 και τελευταία ενότητα παρουσιάζονται πραγματικά αποτέλεσμα από δοκιμές του συστήματος με σκοπό την επικύρωση της σχεδίασης. Για αυτό το λόγο γίνεται σύγκριση των αποτελεσμάτων με τα αποτελέσματα γνωστών πλατφόρμων προσομοίωσης

    Σχεδίαση Αρχιτεκτονικής SoC για τον NRM-SSA

    Get PDF
    Στο Παραδοτέο 1.1 έχει περιγραφεί η σχεδίαση και υλοποίηση συστήματος στοχαστικής προσομοίωσης βασιζόμενο στον αλγόριθμο First Reaction Method (FRM) του Gillespie. Η παράλληλη και πολυπύρηνη αρχιτεκτονική που ενσωματώνει, η δυνατότητα παραμετροποίησης των πυρήνων, καθώς και η άκρως ικανοποιητική απόδοσή τους, ανέδειξαν τα πλεονεκτήματα και τη σπουδαιότητα της χρήσης υλικού ειδικού σκοπού για εφαρμογές στοχαστικής προσομοίωσης βιολογικών δικτύων με τη χρήση FPGAs. Το παρόν παραδοτέο επικεντρώνεται στην ανάπτυξη ενός ολοκληρωμένου υπολογιστικού συστήματος στοχαστικής προσομοίωσης βασιζόμενο στον αλγόριθμο Next Reaction Method (NRM) των Gibson και Bruck [17]. Σκοπός μας ήταν να επαναχρησιμοποιήσουμε μέρος του συστήματος που έχει ήδη σχεδιαστεί για τον FRM–SSA, ώστε να ελαχιστοποιηθεί ο χρόνος σχεδίασης, και να οδηγηθούμε σε μια αποδοτική λύση εφαρμόζοντας τεχνικές πλήρους σωλήνωσης (pipeline), παράλληλης επεξεργασίας (parallel processing) και απόκρυψης της καθυστέρησης (latency hiding) σε επίπεδο υλικού. Εν τέλει, μετά την ολοκλήρωση και την επικύρωση των δύο συστημάτων, σκοπεύουμε να συγκρίνουμε τις δύο αρχιτεκτονικές υλοποιήσεις τόσο ως προς την αποδοτικότητα, επιδόσεις και απαιτήσεις υλικού, όσο και ως προς τον βαθμό στατιστικής ομοιότητας που παρουσιάζουν τα αποτελέσματά τους εκτελώντας τα ίδια πειράματα κάτω από τις ίδιες συνθήκες (Παραδοτέο 1.3)

    Σχεδίαση και FPGA υλοποίηση συστήματος σε ψηφίδα για στοχαστική προσομοίωση πολύπλοκων βιομοριακών δικτύων με χρήση του NRM-SSA

    Get PDF
    Η στοχαστική προσομοίωση μεγάλης κλίμακας δικτύων βιομοριακών αλληλεπιδράσεων, με χιλιάδες αντιδράσεις και μοριακά είδη, αποτελεί σημαντικό εργαλείο για τη Συστημική Βιολογία και τη Συστημική Ιατρική, που θα επιτρέψει τον πειραματισμό in-silico με βιομοριακά δίκτυα κλίμακας κυττάρου ή/και κυτταρικών πληθυσμών. Παρουσιάζουμε τη σχεδίαση και υλοποίηση διαμορφώσιμου παραμετρικού συστήματος σε ψηφίδα (System-on-Chip, SoC) υψηλής απόδοσης, για την επιτάχυνση του αλγορίθμου Next Reaction Method των Gibson και Bruck, σε υλικό επαναπρογραμματιζόμενης λογικής (FPGA). Το σύστημά μας χρησιμοποιεί επιθετική διοχέτευση (pipelining) στο επίπεδο του πυρήνα (core) και συνδυάζει πολλούς πυρήνες σε δίκτυο αστέρα, ικανούς να εκτελούν παράλληλα και αποδοτικά επαναλήψεις στοχαστικής προσομοίωσης βιομοντέλων με έως και 4Κ αντιδράσεις 3ης τάξης. Με τη σχεδίαση που επιλέξαμε, η απόδοση του πυρήνα NRM εξαρτάται μόνο από το μέσο όρο των επηρεαζόμενων αντιδράσεων και όχι από το πλήθος των αντιδράσεων του μοντέλου. Καθώς αυξάνεται το πλήθος των πυρήνων, η απόδοσή του SoC κλιμακώνεται γραμμικά και φτάνει σε επίπεδο GCycles/sec. Συνεπώς με ένα μεσαίου μεγέθους FPGA και συχνότητα λειτουργίας ~200 MHz το σύστημά μας αποφέρει πολύ υψηλές επιδόσεις σε σχέση με δημοφιλείς προσομοιωτές λογισμικού που τρέχουν σε ένα ισχυρό υπολογιστικό σύστημα. Αποτελεί δε το γρηγορότερο σύστημα στη διεθνή βιβλιογραφία για στοχαστικές προσομοιώσεις βιολογικών δικτύων με τον δημοφιλή NRM-SSA.Stochastic simulation of large-scale biochemical reaction networks, with thousands of reactions, is an important tool for systems biology and systems medicine, since it enables the in-silico experimentation with genome-scale reconstructed networks. FPGA-based accelerators can exploit parallelism, but have been limited on the size of biomodels they can handle effectively. In this graduate thesis, we present the design and implementation of a high performance scalable System-on-Chip architecture for implementing Gibson and Bruck's Next Reaction Method in reconfigurable hardware. Our MPSoC uses aggressive pipelining at the core level and combines many cores into a star configuration Network-on-Chip to execute in parallel stochastic repetitions of complex biomodels, each one with up to 4K reactions. The performance of our NRM core depends only on the average number of dependent reactions (outdegree of the biomodel's Dependencies Graph - DG) and not on the number of reactions (DG nodes). By adding cores to the NoC, the system's performance scales linearly and reaches GCycles/sec levels. We show that a medium size FPGA running at ~200 MHz delivers high speedup relative to popular and efficient software simulators running on a very powerful workstation. This is currently the fastest hardware accelerator available in the literature for the NRM-SSA

    Reconfigurable Hardware Acceleration of Exact Stochastic Simulation

    Get PDF
    This thesis explores the use of reconfigurable hardware in modeling chemical species reacting in a spatially homogeneous environment. The time evolution of biochemical models is often evaluated using a deterministic approach that uses differential equations to describe the chemical interactions of the model. However, such an approach treats species as continuous valued concentrations, is inaccurate for small species populations, and neglects the stochastic nature of biochemical systems. The Stochastic Simulation Algorithm (SSA) developed by Gillespie is able to properly account for these inherent noise fluctuations. This allows the SSA to accurately project the time evolution of a biochemical model. Unfortunately, the SSA can be computationally intensive and require a substantial amount of time to complete. Therefore, it has been proposed that the SSA be implemented on a Field Programmable Gate Array (FPGA) to improve performance. Employing an FPGA allows parallelism to be exploited within the SSA providing a speedup over software implementations executing instructions sequentially. Recent work in this area has focused on implementing the SSA on an FPGA to simulate specific biochemical models. However, this requires re-constructing and re-synthesizing the design in order to simulate a new biochemical system. This work examines the use of a reconfigurable computing platform to allow an implementation of the SSA on an FPGA to simulate a variety of models. The designs presented herein demonstrate a speedup of roughly 1.5X

    Σχεδίαση και FPGA Υλοποίηση IP πυρήνων και SoCs για Παράλληλη Στοχαστική Προσομοίωση Βιολογικών Δικτύων

    Get PDF
    Η προσομοίωση ολόκληρου του κυττάρου αποτελεί μια από τις μεγαλύτερες προκλήσεις του 21ου αιώνα. Σε κυτταρικό επίπεδο ένα βιοχημικό σύστημα μπορεί να περιγράφεται από χιλιάδες αντιδράσεις όπου συμμετέχουν αλληλοεπιδρώντα μοριακά είδη. Ωστόσο τα σημερινά υπολογιστικά συστήματα αδυνατούν να διαχειριστούν αποδοτικά βιομοντέλα τέτοιας πολυπλοκότητας. Το αντικείμενο της παρούσας διπλωματικής εργασίας είναι η σχεδίαση και ανάπτυξη ενός ενσωματωμένου υπολογιστικού συστήματος το οποίο θα μπορεί να χρησιμοποιηθεί για τη στοχαστική προσομοίωση βιομοντέλων χιλιάδων αντιδράσεων. Μέσω VHDL περιγραφών υλοποιήσαμε με FPGAs μια ευέλικτη πολυπύρηνη αρχιτεκτονική που στόχο έχει την παράλληλη εκτέλεση στοχαστικών προσομοιώσεων χρησιμοποιώντας τον αλγόριθμο του Gillespie, First Reaction Method. Η αρχιτεκτονική που αναπτύχθηκε έχει την μορφή "μαλακού πυρήνα" (soft IP core) και είναι πλήρως παραμετρική ως προς τα χαρακτηριστικά του βιομοντέλου αλλά και ως προς τη δέσμευση πόρων υλικού. Χρησιμοποιεί έναν υπολογιστή γενικού σκοπού για την επικοινωνία του χρήστη και υποστηρίζει προσομοιώσεις βιομοντέλων με έως 4Κ αντιδράσεις σε ένα μετρίου μεγέθους FPGA. Τέλος αποδεικνύεται ότι το σύστημα που αναπτύχθηκε λειτουργώντας στη συχνότητα των 220 MHz μπορεί να επιταχύνει την διαδικασία της προσομοίωσης έως και 17.6 φορές σε σύγκριση με τη σειριακή εκτέλεση του αλγορίθμου από δημοφιλή προγράμματα προσομοίωσης βιοχημικών δικτύων όπως το COPASI.Whole cell simulation is one of the greatest challenges of the 21st century. A biochemical system at the cellular level may involve thousands of reaction channels and molecular species. However at present, computational tools are unable to handle efficiently the simulation of biomodels of such a high complexity. In this thesis we designed and developed a System-on-Chip to simulate efficiently and stochastically biomodels with practically any number of reaction channels given an appropriate size FPGA. Using parametric VHDL descriptions we realized a flexible multicore architecture to perform in parallel stochastic simulations based on Gillespie’s First Reaction Method. Our MPSoC architecture is captured as a soft IP core that is fully parametric in terms of biomodel’s characteristics and hardware resources and serves as an accelerator to a general purpose PC, the front-end for user interaction. It supports the stochastic simulation of biochemical reaction networks with up to 4K reaction channels and molecular species using a medium-size FPGA. It is shown that the system when operating at 220 MHz can accelerate simulation by a factor of 17.6 compared to well-known serial software simulator COPASI running on a very fast compute server

    Υλοποίηση συστημάτων σε ψηφίδα(SoC) για τη στοαχαστική προσμοίωση μεγάλων δικτύων βιοχημικών αντιδράσεων

    Get PDF
     Η παρούσα Διπλωματική Εργασία, αφορά την υλοποίηση ενός ψηφιακού συστήματος (SoC) ειδικού σκοπού με στόχο την στοχαστική προσομοίωση μεγάλων δικτύων βιοχημικών αντιδράσεων με FPGAs της Xilinx και της Altera. Προτείνονται σχεδιάσεις μικροϋπολογιστών συστημάτων για τη παράλληλη επεξεργασία των αλγορίθμων προσομοίωσης αλλά και την παράλληλη εκτέλεση ανεξάρτητων προσομοιώσεων στο ίδιο σύστημα. Για τον λόγο αυτό κατασκευάσαμε SoCs με μέχρι 8 παράλληλα επεξεργαστικά στοιχεία τα οποία έχουν τη δυνατότητα να εκτελούν παράλληλα δύο από τους πιο γνωστούς αλγορίθμους στοχαστικής προσομοίωσης, τον Gillespie SSA First Reaction Method και τον SSA Next Reaction Method. Τα SoCs που σχεδιάστηκαν μπορούν να προσομοιώσουν δίκτυα με μέχρι 16Κ χημικές αντιδράσεις που η κάθε μια μπορεί να είναι μέχρι και 3ης τάξης. Η συχνότητα λειτουργίας στα FPGA ανέρχεται στα 266-320 MHz με εσωτερικές τις καθυστερήσεις να κυμαίνονται από 55-85 κύκλους ανά χημική αντίδραση. Επιπροσθέτως έγινε μελέτη για την διεπαφή του ψηφιακού συστήματος με τον μικροεπεξεργαστή LEON και χρήση του προγράμματος SysPy για τη δημιουργία ενός εργαλείου επικοινωνίας με το χρήστη, με στόχο την αυτοματοποίηση των λειτουργιών της σύνθεσης του ψηφιακού συστήματος, αναλόγως των απαιτήσεων του βιοχημικού μοντέλου που προσομοιώνεται, αλλά και τη μεταφορά των αποτελεσμάτων της προσομοίωσης στον Η/Υ. This thesis presents the design of scalable reconfigurable parametric Systems on Chip (SoC) that implement Gillespie’s Stochastic Simulation Algorithms (SSA), namely the First Reaction Method and Gibson and Bruck’s Next Reaction Method. We have proved that our architectures of scalable SoCs can deliver performance (Mega reactions/sec) which is increasing linearly with the number of parallel processors, when simulating bimolecular networks with up to 16Κ reactions in a single FPGA. This is important because it contributes to systems biology by enabling realistic simulation of increasingly larger reaction networks (e.g. large metabolic networks or whole species reaction networks). In order to do so, we have designed and verified various scalable parametric FRM/NRM SoC architectures with N=1,2,4 Processing Elements (PEs) for Xilinx Virtex 5 and Virtex 7 FPGAs, reaching clock frequencies as high as 320 MHz and delivering throughput as high as 3.1 Mega Reaction cycles/sec. A new approach is also presented which can simulate biochemical reaction networks of different reaction orders with multiple products. Using it we are able to perform either one parallel simulation of a reaction network in parallel, or N different independent simulations of reaction networks within the same SoC with N PEs, for both SSA algorithms (FRM, NRM)
    corecore