47 research outputs found

    Characterization of the Burst Stabilization Protocol for the RR/RR CICQ Switch

    Full text link
    Input buffered switches with Virtual Output Queueing (VOQ) can be unstable when presented with unbalanced loads. Existing scheduling algorithms, including iSLIP for Input Queued (IQ) switches and Round Robin (RR) for Combined Input and Crossbar Queued (CICQ) switches, exhibit instability for some schedulable loads. We investigate the use of a queue length threshold and bursting mechanism to achieve stability without requiring internal speed-up. An analytical model is developed to prove that the burst stabilization protocol achieves stability and to predict the minimum burst value needed as a function of offered load. The analytical model is shown to have very good agreement with simulation results. These results show the advantage of the RR/RR CICQ switch as a contender for the next generation of high-speed switches.Comment: Presented at the 28th Annual IEEE Conference on Local Computer Networks (LCN), Bonn/Konigswinter, Germany, Oct 20-24, 200

    Efficient Variable Length Block Switching Mechanism

    Get PDF
    Most popular and widely used packet switch architecture is the crossbar. Its attractive characteristics are simplicity, non-blocking and support for simultaneous multiple packet transmission across the switch. The special version of crossbar switch is Combined Input Crossbar Queue (CICQ) switch. It overcomes the limitations of un-buffered crossbar by employing buffers at each crosspoint in addition to buffering at each input port. Adoption of Crosspoint Buffer (CB) simplifies the scheduling complexity and adapts the distributed nature of scheduling. As a result, matching operation is not needed. Moreover, it supports variable length packets transmission without segmentation. Native switching of variable length packet transmission results in unfairness. To overcome this unfairness, Fixed Length Block Transfer mechanism has been proposed. It has the following drawbacks: (a) Fragmented packets are reassembled at the Crosspoint Buffer (CB). Hence, minimum buffer requirement at each crosspoint is twice the maximum size of the block. When number of ports are more, existence of such a switch is infeasible, due to the restricted memory available in switch core. (b) Reassembly circuit at each crosspoint adds the cost of the switch. (c) Packet is eligible to transfer from CB to output only when the entire packet arrives at the CB, which increases the latency of the fragmented packet in the switch. To overcome these drawbacks, this paper presents Variable Length Block Transfer mechanism. It does not require internal speedup, segmentation and reassembly circuits. Using simulation it is shown that proposed mechanism is superior to Fixed Length Block Transfer mechanism in terms of delay and throughput

    Host and Network Optimizations for Performance Enhancement and Energy Efficiency in Data Center Networks

    Get PDF
    Modern data centers host hundreds of thousands of servers to achieve economies of scale. Such a huge number of servers create challenges for the data center network (DCN) to provide proportionally large bandwidth. In addition, the deployment of virtual machines (VMs) in data centers raises the requirements for efficient resource allocation and find-grained resource sharing. Further, the large number of servers and switches in the data center consume significant amounts of energy. Even though servers become more energy efficient with various energy saving techniques, DCN still accounts for 20% to 50% of the energy consumed by the entire data center. The objective of this dissertation is to enhance DCN performance as well as its energy efficiency by conducting optimizations on both host and network sides. First, as the DCN demands huge bisection bandwidth to interconnect all the servers, we propose a parallel packet switch (PPS) architecture that directly processes variable length packets without segmentation-and-reassembly (SAR). The proposed PPS achieves large bandwidth by combining switching capacities of multiple fabrics, and it further improves the switch throughput by avoiding padding bits in SAR. Second, since certain resource demands of the VM are bursty and demonstrate stochastic nature, to satisfy both deterministic and stochastic demands in VM placement, we propose the Max-Min Multidimensional Stochastic Bin Packing (M3SBP) algorithm. M3SBP calculates an equivalent deterministic value for the stochastic demands, and maximizes the minimum resource utilization ratio of each server. Third, to provide necessary traffic isolation for VMs that share the same physical network adapter, we propose the Flow-level Bandwidth Provisioning (FBP) algorithm. By reducing the flow scheduling problem to multiple stages of packet queuing problems, FBP guarantees the provisioned bandwidth and delay performance for each flow. Finally, while DCNs are typically provisioned with full bisection bandwidth, DCN traffic demonstrates fluctuating patterns, we propose a joint host-network optimization scheme to enhance the energy efficiency of DCNs during off-peak traffic hours. The proposed scheme utilizes a unified representation method that converts the VM placement problem to a routing problem and employs depth-first and best-fit search to find efficient paths for flows

    Spatio-temporal Data Plane Design For Software Defined Cellular Networks (sdcn)

    Get PDF
    Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2015Thesis (M.Sc.) -- İstanbul Technical University, Instıtute of Science and Technology, 2015Son yıllarda hızla artan IP trafik yoğunluğu ağ yönetimini zorlaştırmaktadır. CISCO’nun Görsel Haberleşme Ağı Göstergesi'ne (Visual Networking Index) göre, dünya çapında toplam IP trafiği geçtiğimiz beş yılda beş kattan fazla artış göstermiştir, ve önümüzdeki beş yılda bu değerin üç katına çıkacağı öngörülmektedir. Günümüzde var olan trafik kontrol mekanizmaları, aşırı artan trafik yoğunluğu karşısında esnek olmadığı için yeterli kaynak verimliliği sağlayamaz ve trafik yoğunluğunun neden olduğu ciddi servis kalitesi düşüklüklüklerini engellemede yetersiz kalır. Sonuç olarak, geleneksel ağ kontrol mekanizmaları, hızla gelişen mobil teknolojiler ve buna bağlı olarak artan veri trafiği karşısında kullanıcı gereksinimlerini karşılayamaz hale gelmiştir. IP trafik yoğunluğunun günümüzde gelmiş olduğu bu noktada, trafik artışına karşı esnek olabilen ve fiziksel topolojinin karmaşıklığını ortadan kaldırarak ağı kolayca yönetebilen dinamik bir mekanizmaya ihtiyaç duyulmaktadır. Bu problemi çözebilmek için fiziksel ağ topolojisinin karmaşık yapısını azaltan ve merkezi bir yaklaşım ile tüm topoloji üzerinde hakimiyet sağlayarak ağı tek bir noktadan dinamik bir şekilde yönetebilen yeni nesil YThA teknolojisi geliştirilmiştir. Bu teknoloji ile anahtarların mantıksal kısmı kontrol katmanına taşınarak, bu cihazlar veri katmanında akılsız hale getirilip yönetimi kolaylaştırılmıştır. Veri katmanında yer alan fiziksel cihazlar ile kontrol katmanında yer alan ve bu cihazların yönetiminden sorumlu olan Kontrolör, YThA teknolojisi için tanımlanan OpenFlow protokolünü kullanarak haberleşmektedir. Böylece, YThA ve bu yapının kullandığı OpenFlow protokolü sayesinde, her fiziksel anahtarın birer birer konfigüre ve kontrol edilmesi yerine, fiziksel cihazların ağ kontrol birimi olan Kontrolör tarafından yönetimi kolayca sağlanmıştır. Ancak, YThA mekanizmasının ağ yönetiminde sağladığı esneklik ve fonksiyonelliğin yanında, OpenFlow anahtar yapısından kaynaklı olarak akış servis kalitesini kötü yönde etkileyen ve göz ardı edilmemesi gereken ek bir yönlendirme gecikmesi oluşmaktadır. Bu gecikmenin temel nedeni, bir akış yönlendirilirken OpenFlow anahtar yapısındaki akış tablosu iş hattında, birçok bitlik alanın birden fazla tabloda karşılaştırma ve eşleştirme gerektirmesidir. Geleneksel OF anahtarına giriş portları aracılığıyla iletilen bir akış, akış tablosu iş hattında yer alan tablolarda ilgili eşleşmelerden geçtikten ve başlık alanlarındaki bilgiler düzenlendikten sonra çıkış portları üzerinden tekrar ağa gönderilir. Akışın anahtar içerisinde geçirdiği süreçte, başlık alanları üzerinde herhangi bir değişiklik gerektirmeyen bazı eşleştirmeler de söz konusu olabilmektedir. Ayrıca, ağdaki anahtara iletilen akışların iş hattındaki ilerleyişi seri olarak devam etmektedir. Diğer bir deyişle, akış tablosu iş hattının tasarımından dolayı, iş hattında farklı akışlara paralel olarak hizmet verilememektedir. Geneksel OF anahtarında yer alan tüm bu mimari kısıtlar ve akış tablosu iş hattındaki tasarımsal eksiklikler, akışın yönlendirilmesi sırasında ilave gecikmeye neden olduğu gibi bellek kullanımı ve donanım maliyeti açısından da fazladan masrafa neden olmaktadır. YThA teknolojisinde, anahtar mimarisinden kaynaklanan iki önemli dezavantaj belleksel karmaşıklık ve zamansal karmaşıklık olarak sıralanabilir. Bu tez çalışmasında, belleksel karmaşıklık mimaride yer alan donanım maliyeti ya da bellek maliyeti olarak tanımlanırken, zamansal karmaşıklık ise akış yönlendirmesi sırasında ortaya çıkan gecikmeyi işaret etmektedir. YThA teknolojisinin veri katmanında, anahtar yapısından kaynaklı belleksel ve zamansal karmaşıklığı azaltmak üzere, OpenFlow akış yönlendirme mekanizması ile ilgili literatürde birçok çalışma yer almaktadır. Bunların başlıcaları anahtar üzerindeki arama için Hash yönteminden yararlanma, arama verilerini önbelleğe alma, akış eşleşmesi aranırken mükemmel hash yöntemi kullanma olarak sıralanabilir. Ancak, bu ve benzeri arama yöntemleri kullanan ve bir karar mekanizmasına dayalı olarak ön bellekleme yapan çalışmalar, OpenFlow anahtarlarının çalışma yapısındaki akılsızlık özelliğini bozmaktadır. Halbuki akılsız anahtarların Kontrolör tarafından yönetimi daha kolay olduğu gibi, bu cihazların akış yönlendirmesi daha hızlıdır. Belirtilen problemlerin çözümü için sunulacak yöntem, hem OpenFlow anahtarının akılsızlığını bozmayan hem de akış yönlendirilmesinde daha az eşleştirme yaparak akışın servis kalitesini iyi yönde etkileyen ve gecikmeyi azaltan yapıda olmalıdır. Ağda performans iyileştirmesi sağlarken OpenFlow anahtarının akılsızlık özelliğini bozmadan çalışababilecek bir yapı tasarlamak adına, bu tez çalışmasında, iş hattında yer alan tablolar çok katmanlı bir iş hattı mimarisi oluşturacak şekilde konumlandırılmıştır. Çok katmanlı anahtar mimarisi kullanarak, enine bağlantılı (crossbar) geleneksel mimariye göre, belleksel karmaşıklık azaltılmış ve anahtar yapısının donanımsal maliyeti düşürülmüştür. Önerilen mimaride iş hattında kullanılan çok katmanlı yapı 3 katmandan oluşmaktadır. Önerilen yapıda geleneksel OpenFlow anahtarının akış tablo dizilimindeki iş hattı yapısı değiştirilerek bir tablodan gidilebilecek tablo sayısı ikiye çıkartılmıştır. Anahtar mimarisinde yapılan bu değişikleri OpenFlow protokolü ile uyumlu hale getirmek adına, akışların başlık yapısında gerçekleştirilen ufak bir değişiklik ile iş hattındaki tablolar arası yönlendirmeyi sağlayan bir bitlik bir sonraki tablo belirteci eklenmiştir. Böylece, iş hattında gidilecek bir sonraki tablo, protokol ile belirlenirken, OpenFlow anahtarının akılsızlık özelliği korunmuştur. Ayrıca, çok katmanlı OpenFlow iş hattındaki tablolara birer mikroişlemci atanarak Yonga Üstü İletişim Ağı (Network On Chip-NOC) mekanizmasının sağladığı avantajlar OpenFlow anahtarına uygulanmıştır. NOC’ta, kullanılabilen birçok ortak yol (multi-bus) ve bu yollar üzerinde rezerve edilebilecek birçok mikroişlemci bulunduğu için anahtar içerisinde birim zamanda birden fazla akışa paralel olarak hizmet verilebilir. Geleneksel iş hattı yapısında bulunmayan bu özellik ile paralel akış işleme süreci elde edilmiştir. Bu sayede, akışlar arasındaki kaynak yarışını en aza indiren NOC tasarımı, akışın yönlendirme gecikmesini azaltarak servis kalitesinin arttırımında büyük ölçüde katkı sağlar. Sonuç olarak bu tez çalışmasında, çok katmanlı mimari modeli için üç katmandan oluşan ağ mimarisi kullanılarak, anahtar içerisindeki akış tablosu iş hattı yapısı ve bu iş hattındaki tablo bağlantıları yeniden düzenlenmiştir. Ayrıca, anahtar mimarisi için Yonga Üstü İletişim Ağı yapısına benzer bir mimari oluşturmak ve bu mimarinin avantajlarından yararlanmak adına, her bir akış tablosuna, geleneksel yapıdaki tek bir mikroişlemci yerine, birim zamanda sadece bir komut gerçekleştirebilecek kapasitede birer mikroişlemci yerleştirilmiştir. Böylece, OpenFlow anahtarındaki bir iş hattı yapısı paralel çalışabilen birçok iş hattı yapısına dönüştürülmüştür. Ayrıca, anahtarların akılsızlık özelliğinin korunması adına, akışın çok katmanlı ağ mimarisindeki hareketi, ilgili akış tablo satırına bir sonraki tabloyu belirten bir bitlik belirteç eklenmesi ile gerçeklenmiştir. Geleneksel anahtar yapısının ve önerilen anahtar yapısının performans incelemesi ve karşılaştırması için anahtar içerisindeki iş hattı mimarisini modellerken kuyruklama teoreminde yararlanmıştır. Her iki mimaride yer alan iş hattı bölümü kuyruk ve sunucudan oluşan bir yapı ile modellenmiştir. Kullanılan modelde, her bir tablo, akışa hizmet veren ve eşleştirme işlemini gerçekleştiren bir sunucu olarak düşünülmüştür. Geleneksel yapıda ve önerilen yapıda kullanılan iş hattı tasarımına göre modelin uygun bölümlerine kuyruk eklenmiştir ve belirli bir varış oranında anahtara gelen akışlar bu kuyruklarda bekletilmiştir. Kuyruklama teoremi kullanılarak oluşturulan modelde, belleksel karmaşıklık ve zamansal karmaşıklık ölçütü olarak CC (CMsOFC_{MsOF}, CCONC_{CON}) ve TT (TMsOFT_{MsOF}, TCONT_{CON}) adında iki yeni parametre tanımlanmıştır ve geleneksel mimari ile önerilen mimari arasındaki performans incelemesi bu iki parametere üzerinden yürütülmüştür. Belleksel karmaşıklık parametresi ile anahtar mimari yapısının donanım maliyeti formülize edilirken; zamansal karmaşıklık parametresi ile akışın yönlendirme gecikmesi matematiksel olarak ifade edilmiştir. Elde edilen performans sonuçlarına göre, çok katmanlı (3 katmanlı) iş hattı yapısında kullanılan toplam bellek miktarı ve donanımsal bağlantı maliyeti geleneksel anahtar mimarisine göre azalmıştır. Diğer bir deyişle, geleneksel mimaride yer alan belleksel karmaşıklık azaltılmıştır. Ayrıca, önerilen switch modelinin geneleneksel switch modelinden, özellikle kalabalık ağlarda, yedi kata kadar daha az yönlendirme gecikmesi ile akış yönlendirebildiği ve daha iyi hizmet kalitesi (QoS) sağladığı görülmüştür. Böylece, geleneksel mimarinin akış kalitesini köte yönde etkileyen zamansal karmaşıklığın önerilen mimaride azaltıldığı gözlemlenmiştir. Bu çalışmadan elde edilen sonuçlara göre, tabloların dizilişi çok katmanlı ağ mimarisine göre tasarlanarak, akış yönlendirmesi daha az eşleştirme ile gerçekleştirilmiştir. Böylece anahtar sisteminin belleksel ve zamansal karmaşıklığı azaltılarak performans iyileştirmesi sağlanmıştır.The tremendous increase on mobile data traffic has stressed conventional cellular networks recently. Network management has also become difficult because of enormous traffic demand. At this point, a flexible and dynamic control mechanism is needed that diminishes the complexity in physical topology. SDcN, is one of the novel next generation approaches that makes it easier to orchestrate physical devices in Data Plane with its centralized control fashion. SDcN paradigm provides a simple management strategy for network equipments in physical topology by moving their control logic to Control Plane. These equipments in physical topology release their complex decision heuristics to the Controller, so they become simple, dummy equipments. However; on one hand, SDcN provides scalability and flexibility on network management with dummy OpenFlow (OF) switches and its nature of centralized authority; on the other hand, these properties cause spatial and temporal complexity in the Data Plane that should not be regarded according to Quality of Service (QoS) of a flow. Spatial complexity, described in this thesis as Memory UsageMemory~Usage and/or Hardware CostHardware~Cost in an OF switch, should be minimized by removing redundancy in OF switch flow table pipeline. Temporal complexity, defined in this thesis as Flow Forwarding DelayFlow~Forwarding~Delay, should also be reduced by lowering number of comparison in flow table pipeline to enhance QoS of a flow. There are many studies in the literature that try to minimize spatial-temporal complexity in OF switch architecture and also to enhance QoS of a flow. However; most of these works violate dummy characteristic of OF switches because of the fact that they implement some wiser decision mechanism such as hashing, caching and search heuristics within the switch architecture. Any mechanism offered to lower spatial-temporal complexity of OF switch architecture should not violate dummy characteristic of these devices. Otherwise, management of physical devices by a central controller becomes slower, more difficult and complicated. Therefore, we propose a novel OF switch architecture to lower spatial-temporal complexity by using Multi-stage Switch model in flow table pipeline. The proposed model is able to forward a flow by less header matching with its architectural model. The proposed model also protects dummy characteristic with a little alteration in OF protocol header fields. In order to define the next table in the pipeline of proposed Multi-stage model, an additional field called next table identifier is integrated with existing OF protocol header entries. Flow forwarding in each pipeline of Multi-stage model is performed according to this next table identifier. Moreover, the advantages of NoC paradigm are also applied to OF forwarding mechanism with such a Multi-stage switch model by assigning a microcontroller to each flow table in each of pipeline stages. Consequently, thanks to multiple pipeline stages that can serve flows concurrently, the number of flows served per unit time is increased and the QoS of each flow is enhanced. For the performance investigation of proposed model we consider Queuing Theory in the light of a spatial complexity parameter (CC) and a temporal complexity parameter (TT) defined in this work. Total memory usage in a flow table pipeline is measured with spatial complexity parameter and flow forwarding delay is meausered in terms of temporal complexity parameter. These parameters are considered during the performance comparison between conventional OF switch architecture and proposed MsOF switch architecture with CON_{CON} and MsOF_{MsOF} indexes respectively. According to performance evaluation results, MsOFMsOF switch architecture is less spatial complex than conventional one as the number of input ports in an OF switch (NN) increases that corresponds denser topologies. MsOF gains much more memory space by deploying more tables with lower memory sizes, total of (nkn\cdot k). Moreover, MsOFMsOF switch model has less temporal complexity compared to conventional OF switch model, especially in urban areas. With such a Multi-stage deployment for flow tables, proposed MsOF architecture provides approximately 7 times less flow forwarding delayflow~forwarding~delay, TMsOF<7×TCONT_{MsOF} < 7 \times T_{CON}, compared with a conventional OF Switch by virtue of processing flows at different stages of pipeline simultaneously.Yüksek LisansM.Sc

    Scheduling in switches with small internal buffers

    Full text link

    Scheduling and reconfiguration of interconnection network switches

    Get PDF
    Interconnection networks are important parts of modern computing systems, facilitating communication between a system\u27s components. Switches connecting various nodes of an interconnection network serve to move data in the network. The switch\u27s delay and throughput impact the overall performance of the network and thus the system. Scheduling efficient movement of data through a switch and configuring the switch to realize a schedule are the main themes of this research. We consider various interconnection network switches including (i) crossbar-based switches, (ii) circuit-switched tree switches, and (iii) fat-tree switches. For crossbar-based input-queued switches, a recent result established that logarithmic packet delay is possible. However, this result assumes that packet transmission time through the switch is no less than schedule-generation time. We prove that without this assumption (as is the case in practice) packet delay becomes linear. We also report results of simulations that bear out our result for practical switch sizes and indicate that a fast scheduling algorithm reduces not only packet delay but also buffer size. We also propose a fast mesh-of-trees based distributed switch scheduling (maximal-matching based) algorithm that has polylog complexity. A circuit-switched tree (CST) can serve as an interconnect structure for various computing architectures and models such as the self-reconfigurable gate array and the reconfigurable mesh. A CST is a tree structure with source and destination processing elements as leaves and switches as internal nodes. We design several scheduling and configuration algorithms that distributedly partition a given set of communications into non-conflicting subsets and then establish switch settings and paths on the CST corresponding to the communications. A fat-tree is another widely used interconnection structure in many of today\u27s high-performance clusters. We embed a reconfigurable mesh inside a fat-tree switch to generate efficient connections. We present an R-Mesh-based algorithm for a fat-tree switch that creates buses connecting input and output ports corresponding to various communications using that switch

    Scheduling in Networks with Limited Buffers

    Get PDF
    In networks with limited buffer capacity, packet loss can occur at a link even when the average packet arrival rate is low compared to the link's speed. To offer strong loss-rateguarantees, ISPs may need to adopt stringent routing constraints to limit the load at the network links and the routing path length. However, to simultaneously maximize revenue, ISPs should be interested in scheduling algorithms that lead to the least stringent routing constraints. This work attempts to address the ISPs needs as follows. First, by proposing an algorithm that performs well (in terms of routing constraints) on networks of output queued (OQ) routers (that is, ideal routers), and second, by bounding the extra switch fabric speed and buffer capacity required for the emulationof these algorithms in combined input-output queued (CIOQ) routers.The first part of the thesis studies the problem of minimizing the maximum session loss rate in networks of OQ routers. It introduces the Rolling Priority algorithm, a local online scheduling algorithm that offers superior loss guarantees compared to FCFS/Drop Tail and FCFS/Random Drop. Rolling Priority has the following properties: (1) it does not favor any sessions over others at any link, (2) it ensures a proportion of packets from each session are subject to a negligibly small loss probability at every link along the session's path, and (3) maximizes the proportion of packets subject to negligible loss probability. The second part of the thesis studies the emulation of OQ routers using CIOQ. The OQ routers are equipped with a buffer of capacity B packets at every output. For the family of work-conserving scheduling algorithms, we find that whereas every greedy CIOQ policy is valid for the emulation of every OQ algorithm at speedup B, no CIOQ policy is valid at speedup less than the cubic root of B-2 when preemption is allowed. We also find that CCF, a well-studied CIOQ policy, is not valid at any speedup less than B. We then introduce a CIOQ policy CEH, that is valid at speedup greater than the square root of 2(B-1)
    corecore