15 research outputs found

    Σχεδίαση και Υλοποίηση ενός Υποσυστήματος Μνήμης Συνοχής Δεδομένων για Πολυεπεξεργαστές Διαμοιραζόμενης Μνήμης

    No full text
    Recent technology advances in integrated electronics offer the ability to add more and more transistors into modern chips. Chip Multiprocessors (CMPs) are architectures that feature multiple processing cores on a single chip. They result in higher processing power, easier design scalability, and greater performance/power ratio. CMPs appear to be one of the dominating architectural approaches for the years to come in the area of high performance architectures. The purpose of this work is to design and implement a shared memory multi-core system that matches the needs of future CMPs. Specifically, an FPGA-based prototype has been implemented, which constitutes a two-node processing system. The design takes advantage of the two PowerPC cores that are embedded in the FPGA fabric. We have implemented external coherent caches equipped with a MESI protocol, and a bus-based coherent memory interconnect to connect the two processors. Shared memory resides in external DDR memory accessible through the interconnect and the DDR controller. We find that the area overhead of our coherent memory system is 33.4% of a medium-size FPGA. We evaluate the performance of the system by using both simulations and custom software benchmarks running on the two processors. Our simulations show that the system implemented is more efficient than systems based exclusively by Xilinx soft-cores that offer the same type of memory coherence. Our custom benchmarks simulate basic operations found commonly in parallel programs. Our results show that our design scales well with respect to a single processor, for the Merge-Sort algorithm and the Producer-Consumer benchmark that dont require a great amount of synchronization traffic. The speedup measured ranges between 1.89 to 1.92 and 1.89 to 3.45, respectively. On the other hand, the Shared-Counter benchmark slows down by 3 to 10 times due to excessive synchronization traffic.Πρόσφατα τεχνολογικά επιτεύγματα στον τομέα των ολοκληρωμένων κυκλωμάτων προσφέρουν την δυνατότητα πρόσθεσης περισσοτέρων τρανζίστορ στα σημερινά ολοκληρωμένα κυκλώματα. Τα «Ολοκληρωμένα Πολυεπεξεργαστικών Συστημάτων» αποτελούν αρχιτεκτονικές οι οποίες διαθέτουν πολλαπλούς πυρήνες επεξεργασίας στο ίδιο ολοκληρωμένο. Αυτό έχει σαν αποτέλεσμα την αύξηση επεξεργαστικής ισχύς, την ευκολότερη κλιμάκωση της σχεδίασης και την αύξηση του λόγου απόδοσης ανά μονάδα κατανάλωσης. Αυτό το είδος σχεδίασης αναμένεται να επικρατήσει στο μέλλον στον τομέα της αρχιτεκτονικής υπολογιστών. Ο σκοπός αυτή της εργασίας είναι η σχεδίαση και υλοποίηση ενός συστήματος πολλαπλών πυρήνων διαμοιραζόμενης μνήμης, το οποίο προσεγγίζει τις ιδιότητες ενός μελλοντικού πολυεπεξεργαστικού συστήματος. Πρωτότυπο του συστήματος αυτού υλοποιήθηκε σε μια FPGA και αποτελεί ένα σύστημα με δυο επεξεργαστικούς πυρήνες. Το σύστημα αξιοποιεί τους δύο ενσωματωμένους επεξεργαστές PowerPC, οι οποίοι και αποτελούν μέρος του όλου συστήματος. Υλοποιήσαμε εξωτερικές κρυφές μνήμες εφοδιασμένες με πρωτόκολλο συνοχής διαμοιραζόμενης μνήμης και ένα δίκτυο τύπου αρτηρίας για να συνδέσουμε τους δύο επεξεργαστές. Η διαμοιραζόμενη μνήμη βρίσκεται στην εξωτερική DDR μνήμη και είναι προσπελάσιμη μέσω του υπο-συστήματος μνήμης. Το επιπρόσθετο κόστος σε εμβαδόν που εισάγεται από το σύστημά μας είναι 33,4% σε μια FPGA μεσαίου μεγέθους. Αποτιμήσαμε την επίδοση του συστήματός μας χρησιμοποιώντας προσομοιώσεις και δοκιμαστικά προγράμματα που τρέχουν και στους δύο επεξεργαστές. Οι προσομοιώσεις μας έδειξαν ότι το σύστημα που υλοποιήθηκε είναι πιο αποδοτικό από κάθε άλλο που προσφέρει συνεπή διαμοιραζόμενη μνήμη και βασίζεται αποκλειστικά σε κομμάτια από την βιβλιοθήκη της Xilinx. Τα δοκιμαστικά προγράμματα που χρησιμοποιούμε προσομοιώνουν βασικές λειτουργίες που εμφανίζονται συχνά σε παράλληλα προγράμματα. Τα αποτελέσματα δείχνουν ότι η απόδοση του σύστημά μας κλιμακώνεται ομαλά σε σχέση με τον ένα επεξεργαστή, για τον αλγόριθμο ταξινόμησης και το πρόγραμμα Παραγωγού-Καταναλωτή, τα οποία δεν δημιουργούν μεγάλες ποσότητες κίνησης συγχρονισμού. Η επιτάχυνση που μετρήθηκε κυμαίνεται από 1,89 έως 1,92 και από 1,89 έως 3,45, αντίστοιχα. Αντιθέτως, το πρόγραμμα του διαμοιραζόμενου μετρητή επιβραδύνθηκε από 3 έως 10 φορές λόγω υπερβολικής κίνησης συγχρονισμού

    Throughput of Hybrid (DS-SFH) Spread-Spectrum Random-Access Communications.

    No full text
    The multiple-access capability of hybrid direct-sequence slow frequency hopped (DS-SFH) spread-spectrum systems with forward- error control coding is investigated. Frequency-slot synchronous and asynchronous schemes, packet slotted schemes with several chips of the signature sequence employed in each bit (or symbol, if not binary) and varying hopping rates are considered and different data modulation schemes (BPSK, M-ary, FSK) with coherent or noncoherent demodulation are examined. The performance of forward-errorcontrol coding schemes, such as Reed- Solomon codes with errors-only and errors and erasures decoding, with or without side information about the presence or absence of multiple-access interference, is evaluated

    Coagulation-filtration of a secondary effluent by means of pre-hydrolyzed coagulants

    No full text
    Summarization: Jar tests were applied to a secondary effluent in order to determine optimal conditions for coagulation. The metal salts A12(SO4)3), AIC13 and FeCl3 were used as coagulants, and their efficiency under various degrees of pre-hydrolysis was examined. The variables under examination were the dose of the coagulant, the degree of pre-hydrolysis, B=[OH-]/[Me+3], and the pH at two different levels (pH=5.5 and pH=7.5). The efficiency of the various coagulants was evaluated for the removal of turbidity, phosphorous, COD and UV absorbance at 254 nm. The results showed that as far as turbidity removals are concerned, pre-hydrolysis of the aluminum and ferric chloride coagulants at values of B equal to 0.5 to 1 gave optimal results. However, for phosphorous removal, the higher the degree of pre-hydrolysis, the lower the removal of phosphorous. No remarkable differences were observed for the removal of organic matter measured as COD, while alum gave the best results for the reduction in UV absorbance at 254 rim. Direct filtration of the effluent showed that the coagulant dose required was an order of magnitude lower than that required for coagulation. 35 cm of filter bed were sufficient for effective filtration. All coagulants performed well, increasing the degree of turbidity removal as compared to the absence of coagulants. The lowest headloss rate was observed when alum was used, while the highest headloss rate, almost three times as much, when the aluminum chloride coagulants were used (with and without pre-hydrolysis). Ferric coagulants, with or without pre-hydrolysis, demonstrated intermediate headloss rates.Presented on

    Patient evaluation of the received information and help/support on multiple sclerosis.

    No full text
    <p><sup>a</sup>Any patient with missing values was excluded from analysis due to lack of information retrieval by the corresponding source.</p><p><sup>b</sup>Absence of answer in the relevant field of the CRF was considered as no participation in patient union. In total, 86.27% of the study population reported participation in MS unions.</p><p><sup>c</sup>Absence of answer in the relevant field of the CRF was considered as no participation in patient support program. In total, 74.02% of the study population reported participation in support programs.</p><p>Patient evaluation of the received information and help/support on multiple sclerosis.</p
    corecore