6 research outputs found
Understanding and Improving the Latency of DRAM-Based Memory Systems
Over the past two decades, the storage capacity and access bandwidth of main
memory have improved tremendously, by 128x and 20x, respectively. These
improvements are mainly due to the continuous technology scaling of DRAM
(dynamic random-access memory), which has been used as the physical substrate
for main memory. In stark contrast with capacity and bandwidth, DRAM latency
has remained almost constant, reducing by only 1.3x in the same time frame.
Therefore, long DRAM latency continues to be a critical performance bottleneck
in modern systems. Increasing core counts, and the emergence of increasingly
more data-intensive and latency-critical applications further stress the
importance of providing low-latency memory access.
In this dissertation, we identify three main problems that contribute
significantly to long latency of DRAM accesses. To address these problems, we
present a series of new techniques. Our new techniques significantly improve
both system performance and energy efficiency. We also examine the critical
relationship between supply voltage and latency in modern DRAM chips and
develop new mechanisms that exploit this voltage-latency trade-off to improve
energy efficiency.
The key conclusion of this dissertation is that augmenting DRAM architecture
with simple and low-cost features, and developing a better understanding of
manufactured DRAM chips together lead to significant memory latency reduction
as well as energy efficiency improvement. We hope and believe that the proposed
architectural techniques and the detailed experimental data and observations on
real commodity DRAM chips presented in this dissertation will enable
development of other new mechanisms to improve the performance, energy
efficiency, or reliability of future memory systems.Comment: PhD Dissertatio
Packet switch architecture for efficient unicast and multicast traffic switching
У дисертацији је предложена једноставна архитектура свича као и алгоритми за
ефикасно распоређивање и комутацију уникаст и мултикаст саобраћаја, што је од великог
значаја за савремене телекомуникационе мреже у којима количина саобраћаја константно
расте.
Први дио доприноса ове дисертације чини приједлог рјешења свича за ефикасно
управљање уникаст саобраћајем. Ово рјешење је развијено комбинујући најбоље особине
постојећих рјешења, при том избјегавајући одређене њихове недостатке. Циљ је да се
омогући што брже прослијеђивање пакета уз прихватљив ниво хардверске комплексности.
Свич који је развијен у овој дисертацији представља комбинацију свичева са баферима на
улазу и свичева који користе Биркхоф-фон Нојман принцип детерминистичког
конфигурисања комутационог модула па се не захтијева прорачун конфигурација
комутатора. При томе, за разлику од већине рјешења која користе Биркхоф-фон Нојман
принцип конфигурисања, у предложеном рјешењу могуће је користити само један физички
комутациони модул који би обављао функције оба логичка комутациона модула. Да би се
гарантовало да није дошло до поремећаја редослиједа пакета, предложен је и једноставан
алгоритам за одабир пакета за слање. Такође, дат је и приједлог унапријеђења подршке за
фер сервис првобитно предложеног рјешења за комутацију уникаст саобраћаја.
У другом дијелу дисертације, пажња је посвећена унапријеђењу предложеног рјешења
за ефикасно управљање и мултикаст саобраћајем. Потреба за овим се јавила као посљедица
развоја нових сервиса (нпр. IPTV, онлајн игре итд.) који генеришу такав тип саобраћаја. Како
је удио мултикаст саобраћаја у мрежи постао незанемарљив, перформансе свичева који су
развијени примарно за уникаст саобраћај значајно опадају. Рјешење које је предложено у
првом дијелу дисертације је унапријеђено додавањем модула који служи за управљање
мултикаст саобраћајем. Овдје је идеја да се оптерећење са улазног порта који прима
мултикаст пакете распореди на више портова који треба да приме те пакете. Овако је на
релативно једноставан начин омогућено ефикасно управљање мултикаст саобраћајем.
У оквиру дисертације су урађене софтверске симулације које су показале да ова
рјешења постижу врло добре перформансе у односу на постојећа. Такође, урађена је и
хардверска имплементација предложеног основног уникаст рјешења која је показала
релативно скромне захтјеве у погледу хардверских ресурса.The dissertation proposes a simple switch architecture as well as algorithms for efficient
scheduling and switching of unicast and multicast traffic, which is of great importance for modern
telecommunication networks because their traffic load is constantly and rapidly increasing.
The first part of the dissertation’s contributions comprises a proposed switch which
efficiently manages unicast traffic. The proposed switch is developed by using the best
characteristics of the existing solutions while avoiding some of their drawbacks. The aim is to
enable fast packet forwarding while achieving an acceptable level of hardware complexity. The
proposed solution combines architecture with buffers at input ports and Birkhoff-von Neumann
architecture based on deterministic switch module configurations. Hence, calculation of switch
module configurations is not needed. Also, folded architecture is possible, which means that only
one physical switching module is used for both switching stages of Birkhoff-von Neumann
architecture. A simple algorithm for packet scheduling has been developed in order to avoid packet
out-of-sequence problems. Finally, fair service support improvement is introduced for the originally
proposed switch solution.
The second part of the dissertation is devoted to the enhancement of the proposed unicast
switch for efficient management of multicast traffic. The need for multicast support has emerged as
a consequence of the development and introduction of new services (such as IPTV, online gaming,
etc.) that generate multicast traffic. As the amount of multicast traffic is not negligible anymore, the
performance of packet switches that were primarily developed for the unicast traffic is significantly
degraded. The solution proposed in the first part of the diseration is enhanced with the module used
for multicast traffic management. Here, the idea is that the multicast load at some input port is
distributed over ports that are also destination for the multicast packets. This approach enables
relatively simple but efficient management of multicast traffic.
In this dissertation, software simulations were conducted, which confirmed that proposed
solutions achieve very good performances compared to existing solutons. Furthermore, hardware
implementation of the proposed basic unicast switch solution shows modest requirements in terms
of needed hardware resources