5 research outputs found

    An optimized cost-based data allocation model for heterogeneous distributed computing systems

    Get PDF
    Continuous attempts have been made to improve the flexibility and effectiveness of distributed computing systems. Extensive effort in the fields of connectivity technologies, network programs, high processing components, and storage helps to improvise results. However, concerns such as slowness in response, long execution time, and long completion time have been identified as stumbling blocks that hinder performance and require additional attention. These defects increased the total system cost and made the data allocation procedure for a geographically dispersed setup difficult. The load-based architectural model has been strengthened to improve data allocation performance. To do this, an abstract job model is employed, and a data query file containing input data is processed on a directed acyclic graph. The jobs are executed on the processing engine with the lowest execution cost, and the system's total cost is calculated. The total cost is computed by summing the costs of communication, computation, and network. The total cost of the system will be reduced using a Swarm intelligence algorithm. In heterogeneous distributed computing systems, the suggested approach attempts to reduce the system's total cost and improve data distribution. According to simulation results, the technique efficiently lowers total system cost and optimizes partitioned data allocation

    Optimization of energy consumption in cloud computing datacenters

    Get PDF
    Cloud computing has emerged as a practical paradigm for providing IT resources, infrastructure and services. This has led to the establishment of datacenters that have substantial energy demands for their operation. This work investigates the optimization of energy consumption in cloud datacenter using energy efficient allocation of tasks to resources. The work seeks to develop formal optimization models that minimize the energy consumption of computational resources and evaluates the use of existing optimization solvers in testing these models. Integer linear programming (ILP) techniques are used to model the scheduling problem. The objective is to minimize the total power consumed by the active and idle cores of the servers’ CPUs while meeting a set of constraints. Next, we use these models to carry out a detailed performance comparison between a selected set of Generic ILP and 0-1 Boolean satisfiability based solvers in solving the ILP formulations. Simulation results indicate that in some cases the developed models have saved up to 38% in energy consumption when compared to common techniques such as round robin. Furthermore, results also showed that generic ILP solvers had superior performance when compared to SAT-based ILP solvers especially as the number of tasks and resources grow in size

    Quality Of Service Trades-offs Between central Data Centers And Nano Data Centers

    Get PDF
    Tez (Yüksek Lisans) -- İstanbul Teknik Üniversitesi, Fen Bilimleri Enstitüsü, 2015Thesis (M.Sc.) -- İstanbul Technical University, Instıtute of Science and Technology, 2015Hepimiz farkındayız ki günümüzde teknoloji hızla gelişmektedir ve kişilerin gün geçtikçe yeni teknolojik yapılarla karşı karşılaşmasına sebep olmaktadır. Bulut bilişimö web uygulamalarının geliştirmesi ve zenginleştirilmesinde kullanılan en iyi ve yeni teknolojilerinden birisidir. Son yüzyılda, dünyanın dört bir yanındaki internet kullanıcıların büyük bir kısmı bir veya birden fazla internete bağlı cihaza ve bu cihazlardaki çeşitli programlara sahipler. Bu aplikasyonların vasıtası ile üretilen veri hacminin çok büyük bir seviyede olduğundan dolayı ve bunun yanında düşük kalitede veri yönetimi metotları kullanmak neticesinde servis sunucular yavas¸ veya kesintili çalışabilirler ve bu düşük servis kalitesi müşterilerin memnuniyetini ve müşteri sayısını azaltabilir. ˙Internet tabanlı teslimat oluşturucuları günümüzdeki altyapılarda düs¸ük kalitede olan servislerin en önemli sebeplerinden bir tanesidir. Kullanıcılar herhangi bir servis isteği oluşturduklarında o servis isteği internet üzerinden sunuculara ulas¸ır ve sunucu isteği işledikten sonra ona uygun servisi sağlar. Bu işlem zaman alır ve zaman alıcı olmasından dolayı sunucunun servis sağlamasında gecikmelere neden olur. Biz bu çalışmada isteklerin ve servislerin, kullanıcı ve sunucuya ulaşmaları için daha kısa bir mesafe hareket etmelerini ve böylece servislerin daha kaliteli bir şekilde sunulmalarını amaçlıyoruz. Bunun için veri merkezlerini yerel çevrelere taşımayı ve kullanıcıların daha hızlı ve daha az enerji harcayarak servislere ulaşmalarını hedefliyoruz. Bulut bilişimin kendi içerisinde barındırdığı ve belli düzeyde geliştirilmesi gereken kısımları mevcuttur. Bu çalışmada bulut bilişimin alt yapısında bulunan veri merkezinin performansı değerlendirilmiştir. Veri miktarının büyüklüğü günümüzün bu alanda en büyük sorunlarından bir tanesidir. Veri miktarındaki artış, yönetim boşluğuna sebep olmakla birlikte veri merkezinin güncel konfigürasyounun tüketici memnuniyetini karşılamamasına   neden   olmaktadır.      Bu   sebepten   ötürü   bu   çalışmada güncel veri  merkezi  konfigürasyonlarının  yerine  bir  takım  dag˘ıtılmıs¸  veri  merkezlerinin performansı hizmet kalitesini artırmak amacıyla inceleme yoluna gidilmiştir. Yapılan bu çalışmada JAVA programında yazılan ve CloudSim üzerinde inşa edilmiş olan CloudAnalyst simülatörü kullanılmıştır. Mevcut veri merkezi nano düzeydeki veri merkezlerinin değiştirilmesi yoluna başvurularak yeni düzenin eski sistemle kıyaslanması sağlanmıs¸tır. Değişen veri merkezinin özellikleri ise şu şekilde sıralanabilir: Hafıza kapasitesi, işlem hızı, bant genişliği ve bununla birlikte yerel merkezlerine istek gönderen tüketici sayısındaki değişimdir. Bu çalışmada ayrıca tüketici memnuniyeti etkileyen en önemli iki faktör olması sebebiyle eski sistemin ile geliştirilmiş nano düzeydeki yeni sistemi performans açısından ve sistemlerin  kurulum  maliyetleri   açısından  zamana  bag˘lı  olarak  farklı  grafikler üzerinde gösterilmis¸tir.  Bu grafikler  bu  açıdan  deg˘erlendirildig˘inde  nano  düzeydeki      veri      merkezlerinin    mevcut   sisteme   göre   daha   etkili   çalıs¸tıg˘I gözlemlenmis¸tir.   Sonuç olarak nano düzeyde veri merkezlerinin en iyi hizmet verdig˘i es¸ik deg˘erleri tespit edilmis¸tir. Bu  çalıs¸mada  yapılmıs¸  olanlar,  özünde  Nano  servislerinin  kullanıcılar  için  en iyi performansı sağlamaları ve kullanıcılar tarafından olus¸turulan isteklere en iyi bir biçimde hizmet sunmaları için onların yukarda belirlenen özelliklerini değiştirerek en  iyi  çalışacakları  duruma  gelmelerini    sağladık. Ancak  bazı  bu   özelliklerin değiştirildikleri zaman etkileri tepki süresi ve performans maliyeti üzerinde çok düşük bir seviyede olduklarından dolayı bu çalışmada bizim için bellek kapasitesi ve buna benzer olan ilginç ve etkili davranıs¸ları olan özellikler daha önemli olmaktadır. Bu sonuçlar çeşitli sistemlerdeki farklı yapılandırma ihtiyaçlarına göre farklı miktarlarda kullanılabilir olacak. Sonunda ise farklı özelliklerin sonuçlarını bir grafikte göstererek veri merkezlerinin hangilerinin kullanıcılara daha kaliteli servisler sunduğunu grafikteki noktaları kullanarak göstermeye çalışıyoruz. Bu grafikler bazı durumlarda, özellikle veri merkezlerinin kategorilerinin sınırlı bir biçimde değiştirilebilir oldukları zaman onların özelliklerinin daha hassas bir şekilde belirlenmesine yardımcı olurlar. Veri merkezlerinin kalitesi aslında oluşturucuların kalitesinde olması gerekmektedir. Veri merkezlerinin kullanıcı isteklerine istenen kalitede cevap vermeleri için özelliklerinin,   konumu   ve   algoritmasının   ayarlanması gerekmektedir. Kaliteli kablolar, güç dağıtım üniteleri soğutma sistemleri ve benzeri şeylerin sadece bir servis sunucusunun veri merkezi kurulumu konusunda sorunsuz olduğu zaman etkileyici olurlar. Örnek olarak NDCs’ın performansını gerçekten anlamamız için bu konuya herkesin bildiği ve kolayca anladığı bir biçimde yaklaşmamız gerekmektedir. ˙Içinde bulunduğumuz yüzyılda herkesin evinde, masasında ve hatta cebinde interneti bağlı olan cihazlar bulunmaktadır. Laptop, bilgisayar, TV ve tablet gibi cihazlar. Tüm bu cihazlar sürekli veri üretiyorlar ve CDC’lerdeki yönetim eksikliği  ve  aşırı derecede karmaşıklık performansın sorunlu olması ve garanti olmamasına  sebep olur. Günümüzdeki veri merkezleri sunucuları yönetmekte sıkıntı yas¸amaktalar. Bir kullanıcının isteklerine kaliteli bir servis sunulması için düzgün bir şekilde   planlama gerekmektedir. Sistemdeki  herkesin  ve  her  şeyin  birbiri  ile  uyumlu  bir biçimde çalışabilmesi gerekmektedir. Veri merkezlerinin ömrü boyunca sunuculardaki bazı bilinen sıkıntılar onların yapılmasında zorluklara neden olabilir. Mühendislik tasarımı ve yapılandırması, donanımların ömrünün bittiğindeki operasyonlar, donanımların tamiri ve güncellenmesi bu problemlerin bazısıdırlar. Dikkate  alınması  gereken başka sıkıntılar ise, bazı durumlarda kullanıcılar veri merkezleri alanında uzman olmayan bir firmayı tercih edebilirler veya kurucuların veri merkezi sistemlerini bilmiyor olabilirler. Bu bir sürekli olan kalite kontrolü meselesidir. Ayrıca buradaki söylenen problemler sıkça yaşanan problemlerdenler. Bunlarla karşılaşmak aslında her türlü kullanıcı ile çalıştığınız zaman mümkündür. Bazı büyük  firmalarda çalıs¸anlar arasındaki iletis¸im seviyesi çok düs¸ük olur veya küçük bir firmada sizin isteklerinizi kars¸ılayacak kaynaklar bulunmayabilir. Bu yetersizlikler çoğu zamanlarda kullanıcıların internet servisleri kalitesinden memnun kalmamalarına sebep olur ve internet servisi sunucuları servis kalitesinin garantilenmesi için hiçbir şey yapamazlar. Bunun  da  asıl  nedeni  ise  günümüzdeki  kullanılan  topoloji  ve  veri merkezlerinin modelidir. Internet tabanlı servislerin enerjiyi yetersiz kullanmaları ve kalite kontrolünün zorlaşması ve kişiselleştirmede sorun yaşamalarına da dikkat etmemiz lazım.We all know progress speed of technology is really fast and every day we encounter several new topics. Cloud computing is one of the recently emerging technologies in computer science. However cloud computing is almost new, There are lots of gaps that need attention. In our research we decide to consider data centers’ performance in cloud computing infrastructure. Huge amount of data is one of the serious problem in today’s world. This rising amount of data cause lack of management and current configuration of data centers could not satisfy consumer’s requests. We decide to investigate the performance of a specific kind of distributed approach instead of current centralized approach, to check if they could give better quality of services. For our experiment we use CloudAnalyst simulator which written in java and built on CloudSim (Buyya et al., 2009, p. 1265). By replacing a central data center with Nano data centers, we start to check their performance in comparison of central data center. Changing different properties of data center include: memory capacity, processor speed, bandwidth and number of user bases whom send requests to their local data center, we compare central and nano data center performance on different aspects like response time and performance cost, since these two factors are the most important factors we need them to be desirable. By interpreting our charts we show that our nano data centers works much better than central data centers. Finally we try to get some threshold point which our nano data center could give their best quality of services in. Actually we changed different properties of data center to find best point value that in which Nano data centers could reach their best performance and give better quality of services to their requests. However some properties has no impressive effect on response time or performance cost we try to do experiment more on those which act differently, like memory capacity. Also we conduct our experiments with some kind; of proportions between resources to obtain relativistic results. Finally we combine results of different properties two by two in one chart to show points which data centers give better quality of services with considering more than one properties. These kinds of analyses could be beneficial when for example we have a boundary for changing data centers’ categories and by referring to our charts could decide more precisely about constructing data center properties.Yüksek LisansM.Sc

    Експериментальне дослідження енергоефективності обробки даних в розподіленому дата центрі

    Get PDF
    Робота містить 99 сторінок, 31 рисунок та 12 таблиць. Було використано 52 джерела. Мета дослідження – підвищити енергоефективність та продуктивність обробки запитів користувача в гетерогенному ЦОД (центрі обробки даних) оператора зв’язку. Завдання: 1. Дослідити технологію NFV (Network Function Virtualization), а також особливості її використання в мережі LTE. Визначити підхід щодо розрахунку обсягу навантаження, який надходитиме на ЦОД мобільних операторів зв’язку України. 2. Дослідити існуючі алгоритми балансування навантаження в серверному кластері, визначити їх переваги та недоліки. 3. Розробити удосконалений алгоритм балансування навантаження, який покращить енергоефективність обробки даних на основі даних, отриманих за запропонованим розрахунком обсягу навантаження. 4. Створити імітаційну модель серверного кластеру з функцією балансування навантаження в середовищі Matlab, базуючись на отриманих даних. Після проведеної апробації моделі дослідити ефективність запропонованого алгоритму на прикладі дата-центру з середнім розміром (100 вузлів). 5. Розробити крос-платформне ПЗ (програмне забезпечення), яке виконуватиме функції балансування навантаження. ПЗ має містити можливості автоматизованого формування логічних кластерів серед наявних фізичних серверів, які знаходяться як в одній фізичній мережі, так і в різних, а також підтримки функцій балансування навантаження серед усіх вузлів логічного кластера. 6. Провести апробацію розробленої імітаційної моделі. Об’єкт дослідження: процес балансування навантаження в розподілених дата-центрах (серверних кластерах) операторів мобільного зв’язку. Предмет дослідження: підходи щодо покращення ефективності гетерогенної територіально розподіленої віртуалізованої інфраструктури оператора мобільного зв’язку. Методи дослідження: 1. Теоретичне дослідження – математичні методи системного аналізу, загальнодоступні специфікації технологій, наукові праці, статистики та прогнози операторів стільникового зв’язку; 2. Імітаційне моделювання - програма математичного моделювання Matlab; 3. Апробація на обладнанні - серверний кластер Технічного університету Дрездена для перевірки адекватності моделі алгоритмів балансування навантаження. Новизна роботи: Запропонований підхід до енергоефективного планування завдань складається, на відміну від відомих, з двох основних етапів: 1. Етап попередньої атестації; 2. Етап планування завдань. Етап попередньої атестації проводиться у серверному кластері періодично, при його налаштуванні. Індивідуальне визначення функцій P = f(CPU) для кожного вузла обробки та їх подальше використання у процесі планування завдань є ключовою особливістю запропонованого підходу. Другий етап передбачає на відміну від відомих технічних рішень вирішення оптимізаційного завдання за критеріями енергоефективності та продуктивності обробки завдань з використанням індивідуально визначених енергетичних моделей вузлів. Результатом цього процесу є розміщення кожного поточного завдання для обробки на сервер із оптимальними параметрами. Запропонований підхід представлено у вигляді алгоритму планувальника завдань. Обгрунтованість і достовірність наукових положень, висновків і рекомендацій: 1. Проведено аналіз існуючих підходів до підвищення енергоефективності обчислень у центрі обробки даних, який показав наявність низки методів, що мають на меті зниження енергоспоживання під час обробки даних, але не враховують одночасно параметр продуктивності обчислень. 2. Виділено клас методів підвищення енергоефективності обчислень, а саме енергоефективне планування завдань, у рамках якого доцільним є внесення змін з метою покращення показників енергоефективності та продуктивності обчислень. 3. Запропоновано підхід до підвищення енергоефективності обчислень для серверного кластера як інформаційно-телекомунікаційної одиниці інфраструктури ЦОД оператора зв’язку або провайдера онлайн-послуг, який відрізняється одночасним врахуванням параметрів енергоефективності та продуктивності при розподілі завдань. 4. Розроблено алгоритм підвищення енергоефективності обчислень на основі запропонованого підходу, який складається з етапу попередньої індивідуальної атестації серверного кластера та етапу енергоефективного розподілу завдань. Врахування індивідуальних математичних залежностей енергоспоживання серверів з урахуванням їх завантаженості є основною відмінною рисою запропонованого підходу. 5. Перевірено роботу запропонованого підходу експериментально та шляхом імітаційного моделювання. Проведено аналіз отриманих результатів, та визначено, що підхід проявляє більшу ефективність – до 25% за показниками продуктивності та енергоефективності при оптимальних вагових коефіцієнтах – для великих гетерогенних кластерів. Наукове значення роботи: Запропоновані в дисертації підходи щодо удосконалення процесу балансування навантаження в розподілених дата-центрах (серверних кластерах) операторів мобільного зв’язку розширюють спектр можливостей балансування навантаження в серверному кластері, покращуючи енергоефективність обчислень, які в них виконуються, при збереженні поточного рівня QoS під час надання послуг зв’язку. Практичне значення отриманих результатів: Запропоновані в роботі підходи можуть бути використані для покращення енергоефективності існуючих масштабних дата-центрів мобільних операторів зв’язку. Зекономлена електроенергія матиме як економічний (зменшення операційних витрат на функціонування дата-центрів) так і екологічний (зменшення викидів в атмосферу при виробництві електроенергії) ефект. При цьому якісні показники обробки інформації не деградуватимуть і відповідно не нестимуть економічних збитків операторам зв’язку. Особистий внесок магістранта: Була виконана розробка імітаційної моделі з використанням середовища MATLAB. Проведена апробація моделі на реальному обладнанні серверного кластера (якісний і кількісний склад якого був відтворений у моделі MATLAB). Результати апробації вказують, що налаштування моделі було виконане правильно. Створене програмне забезпечення, яке реалізує підхід щодо балансування навантаження, яке дозволить покращити показники енергоспоживання та продуктивності в дата-центрі мобільних операторів зв’язку.The work contains 99 pages, 31 figures and 12 tables, 52 sources have been used. The purpose of the study is to increase the energy efficiency and productivity of processing user requests in a heterogeneous data center (data center) of the telecommunications operator. Task: 1. Explore NFV (Network Function Virtualization) technology for its use in the LTE network. Determine the approach to calculating the load that will be delivered to the data centers of mobile operators of Ukraine. 2. Examine the existing load balancing algorithms in the server cluster, identify their advantages and disadvantages. 3. Develop an improved load balancing algorithm that will improve the energy efficiency of data processing based on the data obtained from the proposed calculation of the load. 4. Create a simulation model of the server cluster with load balancing function in the Matlab environment based on the data received. After testing the model, examine the effectiveness of the proposed algorithm on an example of a data center with an average size (100 nodes). 5. Develop cross-platform software (software) that will perform load balancing functions. The software should include the possibility of automated logical clustering among existing physical servers located both in the same physical network and in different, as well as support for load balancing functions among all nodes in the logical cluster. 6. Conduct the testing of the developed simulation model. Object of research: the process of balancing the load in distributed data centers (server clusters) of mobile operators. Subject of research: approaches to improving the efficiency of the heterogeneous, territorially distributed virtualized infrastructure of the mobile communications operator. Research methods: 1. Theoretical research - mathematical methods of system analysis, publicly available specifications of technologies, scientific works, statistics and forecasts of cellular operators; 2. Imation simulation - a program of mathematical modeling Matlab; 3. Test on the equipment - a server cluster of the Technical University of Dresden to verify the adequacy of the model load balancing algorithms. Novelty of work: The proposed approach to energy efficient planning of tasks is, unlike the known, from two main stages: 1. The stage of preliminary attestation; 2. Task planning stage. The stage of preliminary attestation is performed in the server cluster from time to time, when it is configured. The individual definition of the functions P = f (CPU) for each processing node and their subsequent use in the process of task planning is a key feature of the proposed approach. The second stage involves, in contrast to the known technical solutions, the solution of the optimization task by the criteria of energy efficiency and processing of tasks using individually determined energy models of nodes. The result of this process is to place each of the current tasks for processing on the server with optimal parameters. The proposed approach is presented as a task scheduler algorithm. The validity and reliability of scientific provisions, conclusions and recommendations: 1. An analysis of existing approaches to improving the energy efficiency of computations in the data center has been carried out, which has shown a number of methods aimed at reducing energy consumption during data processing, but do not take into account simultaneously the parameter of computing productivity. 2. A class of methods for increasing energy efficiency of calculations, namely, energy-efficient planning of tasks, in which it is expedient to make changes in order to improve energy efficiency and computational efficiency indicators, is selected. 3. An approach to increasing the energy efficiency of computing for a server cluster as an information and telecommunication unit of a data center infrastructure of a telecommunication operator or an online service provider is proposed, which is different at the same time taking into account the parameters of energy efficiency and productivity when assigning tasks. 4. An algorithm for increasing the energy efficiency of the calculations based on the proposed approach, which consists of the stage of preliminary individual attestation of the server cluster and the stage of energy efficient allocation of tasks, is developed. The consideration of the individual mathematical dependencies of the power consumption of servers, taking into account their load capacity, is the main distinguishing feature of the proposed approach. 5. The work of the proposed approach is tested experimentally and by simulation modeling. The analysis of the obtained results is carried out, and it is determined that the approach is more effective - up to 25% for performance and energy efficiency indicators at optimal weight ratios - for large heterogeneous clusters. The scientific significance of work: The approaches proposed in the dissertation to improve the load balancing process in distributed data centers (server clusters) of mobile operators expands the range of load balancing capabilities in the server cluster by improving the energy efficiency of the calculations that are performed on them while maintaining the current QoS level during communication service provision. The practical value of the results obtained: The approaches proposed in the work can be used to improve the energy efficiency of existing large-scale data centers of mobile operators. The saved energy will have both an economic effect (reducing operating costs for the functioning of the data centers) and the ecological (reduction of atmospheric emissions in the production of electricity) effect. At the same time, the quality indicators of information processing will not degrade and accordingly will not incur economic losses to communication operators. Master student's personal contribution: The simulation model was developed using the MATLAB environment. We tested the model on the real equipment of the server cluster (qualitative and quantitative composition of which was reproduced in the MATLAB model). Approval results indicate that the model configuration was performed correctly. Software has been developed that implements a load balancing approach that will improve the energy and performance in the data center of mobile operators

    Енергоефективне обслуговування навантаження інформаційно-комунікаційної мережі

    Get PDF
    Прокопець Н.А. Енергоефективне обслуговування навантаження інформаційно-комунікаційної мережі. – Кваліфікаційна наукова праця на правах рукопису. Дисертація на здобуття наукового ступеня доктора філософії за спеціальністю 172 – Телекомунікації та радіотехніка. – Навчально-науковий інститут телекомунікаційних систем КПІ ім. Ігоря Сікорського, Київ, 2022. У дисертаційній роботі розв’язано актуальну науково-практичну задачу підвищення енергоефективності та продуктивності обслуговування навантаження інформаційно-комунікаційної мережі (ІКМ) при виконанні вимог щодо доступності системи обслуговування навантаження за рахунок застосування комплексного методу енергоефективного обслуговування навантаження. Функціонування сучасної ІКМ великою мірою залежить від програмного забезпечення (ПЗ), що виконує різноманітні мережеві задачі. Це обумовлено розвитком ряду технологій та концепцій, зокрема SDN (Software-Defined Networking), NFV (Network Functions Virtualization), логічного поділу мережі (Network Slicing), периферійних обчислень (Edge Computing) та bDDN (Big data driven networking). Задачі, що вирішуються в рамках цих концепцій, формують обчислювальне навантаження, для обслуговування якого необхідною є побудова та підтримка розподілених обчислювальних систем як невід’ємної частини архітектури ІКМ. При цьому, особливості цих типів навантаження формують специфічні вимоги щодо його обслуговування. Проведений у роботі аналіз вимог різних типів навантаження ІКМ згідно з рекомендаціями Міжнародної спілки електрозв’язку дозволив визначити основні показники ефективності системи розподіленого обслуговування навантаження у складі ІКМ та серверного кластера як одиниці розподіленого центру обробки даних (ЦОД) у складі ІКМ зокрема: показники енергоефективності та продуктивності обробки обчислювального навантаження, а також коефіцієнт готовності системи розподіленого обслуговування навантаження . На основі цих показників сформовано критерій оптимальності процесу обслуговування навантаження в інформаційно- комунікаційній мережі . В ході аналізу існуючих підходів щодо підвищення енергоефективності розподіленого обслуговування навантаження виявлено певні їх недоліки, а саме: статичні підходи не враховують динамічну змінюваність інтенсивності навантаження; динамічні підходи, що застосовуються на рівні апаратного забезпечення мають високу складність та вартість впровадження. Серед відомих динамічних підходів, що використовуються на рівні програмного забезпечення, підходи щодо консолідації та масштабування обчислювальних ресурсів не враховують показник доступності системи, можуть негативно впливати на продуктивність системи, особливо у випадку динамічних змін інтенсивності навантаження, не використовують індивідуальні характеристики енергоспоживання обчислювальних вузлів, що призводить до неоптимального використання обчислювальних ресурсів. Серед методів енергоефективного розподілу навантаження було відзначено алгоритм планування навантаження Backfill, основною перевагою якого є мінімізація простою обчислювальних вузлів за рахунок щільного розподілу обчислювальних робіт. Однак ефективність цього підходу значно зменшується у випадку невисокої інтенсивності вхідного навантаження, крім того, він не враховує індивідуальні характеристики енергоспоживання та продуктивності обчислювальних вузлів. Окремим сукупним недоліком існуючих підходів є те, що кожен з них вирішує задачу підвищення енергоефективності обслуговування навантаження з урахуванням лише частини аспектів цього процесу та показників його ефективності, що визначило необхідність систематизації та формалізації процесу обслуговування навантаження в інформаційно-комунікаційній мережі. З метою систематизації та формалізації процесу обслуговування навантаження ІКМ як об’єкта дослідження побудовано онтологічну модель досліджуваної системи розподіленого обслуговування навантаження. Це дозволило якісно описати складні взаємозв’язки між виділеними показниками ефективності досліджуваного процесу та параметрами, що впливають на них. З метою отримання кількісної оцінки взаємозв’язків між показниками ефективності досліджуваного процесу та параметрами, що на них впливають, побудовано математичну модель системи розподіленого обслуговування навантаження у складі ІКМ як системи масового обслуговування (СМО). У процесі побудови моделі запропоновано метод переходу від нестаціонарного неординарного вхідного потоку заявок до стаціонарного ординарного потоку шляхом дискретизації кривої інтенсивності вхідного навантаження та за допомогою переходу до комплектів серверів, що дозволило значно спростити розрахунки при допустимих втратах точності моделі. Для дискретизації кривої інтенсивності вхідного навантаження запропоновано використання методу квантування за рівнями, що дозволило узгодити величину кроку дискретизації функції зі швидкістю зміни інтенсивності вхідного навантаження. Для визначення кроку квантування запропоновано метод розрахунку порогових величин інтенсивностей вхідного навантаження як функцій кількості обчислювальних вузлів у системі. На основі побудованої математичної моделі запропоновано метод розрахунку шаблонів горизонтального масштабування, що дозволяє визначати оптимальну кількість активних обчислювальних вузлів у кластерах ЦОД ІКМ на кожному інтервалі часу, який визначається швидкістю зміни інтенсивності вхідного навантаження. Проаналізовано способи визначення індивідуальних моделей енергоспоживання обчислювальних вузлів розподілених ЦОД та обґрунтовано доцільність їх використання у процесі обслуговування навантаження ІКМ. Докладно розглянуто два способи визначення моделей енергоспоживання: емпіричний та програмний. Перший спосіб базується на безпосередньому вимірюванні енергоспоживання вузлів та подальшій інтерполяції отриманих залежностей поліномом ступеня з метою отримання аналітичних функцій. Другий спосіб базується на програмній оцінці енергетичних моделей з подальшою інтерполяцією отриманих функцій. Рекомендовано використання методу емпіричного визначення математичних моделей енергоспоживання для нових систем на етапі їх налаштування. У випадку введення нових вузлів до системи або під час її переатестації, рекомендовано використання аналітичного методу визначення моделей енергоспоживання. Побудовану математичну модель системи у вигляді СМО та розглянуті способи визначення індивідуальних моделей енергоспоживання обчислювальних вузлів покладено в основу нового комплексного методу енергоефективного обслуговування навантаження в ІКМ. Запропонований комплексний метод відрізняється від відомих використанням індивідуальних моделей енергоспоживання обчислювальних вузлів, поєднанням переваг підходів горизонтального масштабування та енергоефективного розподілу задач, врахуванням непередбачуваних динамічних змін інтенсивності вхідного навантаження, що дозволило підвищити енергоефективність процесу обслуговування навантаження без втрати продуктивності та за умови дотримання вимог щодо доступності системи. В рамках запропонованого комплексного методу удосконалено існуючі підходи щодо горизонтального масштабування обчислювальної системи шляхом використання індивідуальних моделей енергоспоживання обчислювальних вузлів та застосування механізму прогнозування динамічних відхилень вхідного навантаження, що дозволило забезпечити інтенсивніше використання найбільш енергоефективного обладнання та вчасно реагувати на непередбачувані зміни інтенсивності вхідного навантаження. На основі запропонованого комплексного методу енергоефективного обслуговування навантаження створено програмне забезпечення (ПЗ) керування обчислювальними ресурсами в ІКМ, яке дозволяє підвищити енергоефективність та продуктивність розподіленого обслуговування навантаження з дотриманням вимог щодо доступності системи обслуговування та може бути використано для підвищення енергоефективності та продуктивності обробки навантаження у периферійній та центральній хмарі в архітектурі мережі 5G. Ефективність запропонованого комплексного методу та ПЗ на його основі перевірено із використанням методів лабораторного експерименту та імітаційного моделювання. Шляхом лабораторного експерименту перевірено ефективність методу у невеликому серверному кластері з 4 обчислювальних вузлів. Імітаційна модель, адекватність якої доведено із використанням критерія Фішера, довела ефективність запропонованого комплексного методу у більшій розподіленій системі із 20 вузлів. Виграш запропонованого комплексного методу у порівнянні із відомими підходами Backfill та Round Robin за показником енергоефективності при цьому склав 9,953% та 26,382% відповідно. Виграш за показником продуктивності становив 5,593% та 49,458% відповідно. При цьому запропонований комплексний метод забезпечує виконання вимог щодо доступності обчислювальних вузлів розподілених ЦОД та дає виграш за обраним критерієм оптимальності на 15,722% у порівнянні із Backfill та на 88,887% у порівнянні з Round Robin, що доводить практичну цінність отриманих результатів дослідження.N.A. Prokopets Energy-efficient processing of the information and communication network workload. – Qualifying scientific work on manuscript rights. Thesis for graduation scientific degree of Philosophy Doctor by specialty 172 – Telecommunications and radio engineering. – Educational and Scientific Institute of Telecommunication Systems of KPI named after Igor Sikorsky, Kyiv, 2022. In the thesis, the important scientific and practical problem of increasing the energy efficiency and performance of workload processing in information and communication network (ICN) while meeting the requirements for the availability of the workload processing system was solved through the use of a comprehensive method of energyefficient workload processing. The functioning of a modern ICN largely depends on the software that performs various network tasks. This is due to the development of a number of technologies and concepts, including SDN (Software-Defined Networking), NFV (Network Functions Virtualization), Network Slicing, Edge Computing and bDDN (Big data driven networking). The tasks being solved within these concepts form a computing workload, for the processing of which it is necessary to build and maintain distributed computing systems as an integral part of the ICN architecture. At the same time, the peculiarities of these types of workload form specific requirements for its processing. The requirements analysis conducted for each of these workload types in accordance with the recommendations of the International Telecommunication Union allowed to determine the main performance indicators of the distributed workload processing system as part of the ICN and the server cluster as a unit of the distributed data center as part of the ICN, in particular: energy efficiency and performance indicators of workload processing, as well as the system availability factor . Based on these indicators, an optimality criterion of workload processing in ICN was proposed. During the analysis of the existing approaches to increase the energy efficiency of distributed workload processing, some shortcomings were revealed, namely: static approaches do not take into account the dynamic variability of the workload; dynamic approaches applied at the hardware level have high complexity and cost of implementation. Among the known dynamic approaches used at the software level, the approaches to consolidation and scaling of computing resources do not take into account the system availability indicator, which can negatively affect the system performance, especially in the case of dynamic changes in the workload arrival rate. They also do not use the individual characteristics of computing nodes’ energy consumption, which leads to suboptimal use of computing resources. Among the approaches to energy-efficient workload scheduling, the Backfill workload scheduling algorithm was noted, the main advantage of which is minimizing the downtime of computing nodes due to the dense distribution of computing work. However, the effectiveness of this approach is significantly reduced in the case of a low input workload arrival rate, in addition, it does not take into account the individual characteristics of energy consumption and performance of computing nodes. A separate collective disadvantage of the existing approaches is that each of them solves the problem of increasing the energy efficiency of workload processing taking into account only part of the aspects of this process and its efficiency indicators, which determined the need to systematize and formalize the workload processing process in the information and communication network. In order to systematize and formalize the workload processing process in the information and communication network as an object of research, an ontological model of a distributed workload processing system was built. This made it possible to qualitatively describe the complex relationships between the selected efficiency indicators of the process being researched and the parameters affecting them. In order to obtain a quantitative assessment of the relationships between the defined efficiency indicators and the parameters that affect them, a mathematical model of the distributed workload processing system within the ICN as a queuing system (QS) was built. While building the model, a method of transition from a non-stationary nonordinary input requests flow to a stationary ordinary flow was proposed by discretizing the intensity curve of the input workload and using the transition to sets of servers, which made it possible to significantly simplify calculations with permissible losses of model accuracy. For the discretization of the input workload arrival rate curve, the use of the quantization by levels was proposed, which made it possible to match the size of the discretization step with the rate of change of the input workload arrival rate. To determine the quantization step, a method of calculating threshold values of input workload arrival rate as a function of the number of computing nodes in the system is proposed. Based on the constructed mathematical model, a method for calculating horizontal scaling patterns is proposed, which allows determining the optimal number of active computing nodes in the system at each time interval, which is determined by the rate the input workload arrival rate change. The methods of determining individual energy consumption models of computing nodes were analyzed and the expediency of their use in the workload processing process in ICN was substantiated. Two methods of determining energy consumption models were considered in detail: empirical and software-based methods. The first method is based on the direct measurement of the energy consumption of the nodes and further interpolation of the obtained dependencies by a polynomial of a degree in order to obtain analytical functions. The second method is based on software-based evaluation of energy consumption models with subsequent interpolation of the obtained functions. It is recommended to use the method of empirical energy consumption models determination for new systems at the stage of their configuration. In the case of introducing new nodes to the system or during its re-configuration, it is recommended to use a software-based method for determining energy consumption models. The built mathematical model of the system in the form of QS and the considered methods of determining individual energy consumption models of computing nodes became the basis of a new comprehensive method of energy-efficient workload processing in computing nodes of distributed data centers. The proposed comprehensive method differs from known ones in the use of individual models of computing nodes’ energy consumption, a combination of the advantages of horizontal scaling approaches and energy-efficient scheduling, while taking into account dynamic changes in the input workload arrival rate, which made it possible to increase the energy efficiency of the workload processing without loss of performance and subject to compliance with system availability requirements. As part of the proposed comprehensive method, the existing approaches to horizontal scaling of the computer system were improved by using individual models of computer nodes’ energy consumption and mechanism for predicting dynamic deviations of the input workload arrival rate, which made it possible to ensure more intensive use of the most energy-efficient equipment and to respond in time to unpredictable changes in the input workload arrival rate. On the basis of the proposed comprehensive method of energy-efficient workload processing, software for managing computing resources has been created, which allows to increase the energy efficiency and performance of distributed workload processing while complying with the requirements for system availability, and can be used to increase the energy efficiency and performance of workload processing in edge and central cloud within the 5G network architecture. The effectiveness of the proposed comprehensive method and the software based on it was verified using the methods of laboratory experiment and simulation modeling. The effectiveness of the method was tested in a small server cluster with 4 computing nodes by means of the experiment. The simulation model, the adequacy of which was proven using Fisher's test, proved the effectiveness of the proposed comprehensive method in a larger distributed system with 20 nodes. The performance of the proposed comprehensive method in comparison with the known Backfill and Round Robin approaches in terms of energy efficiency was 9.953% and 26.382%, respectively. The performance gain was 5.593% and 49.458% respectively. At the same time, the proposed comprehensive method ensures the fulfillment of the requirements regarding the system availability and gives a gain according to the proposed optimality criterion by 15.722% in comparison with Backfill and by 88.887% in comparison with Round Robin, which proves the practical value of the obtained research results
    corecore