6 research outputs found

    Optimizing multi-deployment on clouds by means of self-adaptive prefetching

    Get PDF
    International audienceWith Infrastructure-as-a-Service (IaaS) cloud economics getting increasingly complex and dynamic, resource costs can vary greatly over short periods of time. Therefore, a critical issue is the ability to deploy, boot and terminate VMs very quickly, which enables cloud users to exploit elasticity to find the optimal trade-off between the computational needs (number of resources, usage time) and budget constraints. This paper proposes an adaptive prefetching mechanism aiming to reduce the time required to simultaneously boot a large number of VM instances on clouds from the same initial VM image (multi-deployment). Our proposal does not require any foreknowledge of the exact access pattern. It dynamically adapts to it at run time, enabling the slower instances to learn from the experience of the faster ones. Since all booting instances typically access only a small part of the virtual image along almost the same pattern, the required data can be pre-fetched in the background. Large scale experiments under concurrency on hundreds of nodes show that introducing such a prefetching mechanism can achieve a speed-up of up to 35% when compared to simple on-demand fetching

    Towards Efficient Live Migration of I/O Intensive Workloads: A Transparent Storage Transfer Proposal

    Get PDF
    Live migration of virtual machines (VMs) is key feature of virtualization that is extensively leveraged in IaaS cloud environments: it is the basic building block of several important features, such as load balancing, pro-active fault tolerance, power management, online maintenance, etc. While most live migration efforts concentrate on how to transfer the memory from source to destination during the migration process, comparatively little attention has been devoted to the transfer of storage. This problem is gaining increasing importance: due to performance reasons, virtual machines that run I/O intensive workloads tend to rely on local storage, which poses a difficult challenge on live migration: it needs to handle storage transfer in addition to memory transfer. This paper proposes a completely hypervisor-transparent approach that addresses this challenge. It relies on a hybrid active push-prioritized prefetch strategy, which makes it highly resilient to rapid changes of disk state exhibited by I/O intensive workloads. At the same time, transparency ensures a maximum of portability with a wide range of hypervisors. Large scale experiments that involve multiple simultaneous migrations of both synthetic benchmarks and a real scientiïŹc application show improvements of up to 10x faster migration time, 5x less bandwidth consumption and 62% less performance degradation over state-of-art

    Comment conduire des milliers d'expériences pour analyser les temps de démarrage d'un environment d'exécution de type machines virtuelle ou conteneur

    Get PDF
    While many studies have been focusing on reducing the time to manipulate Virtual Machine/Container images in order to optimize provisioning operations in a Cloud infrastructure, only a few studies have considered the time required to boot these systems. Some previous researches showed that the whole boot process can last from a few seconds to few minutes depending on co-located workloads and the number of concurrent deployed machines. In this paper, we discuss a large experimental campaign that allows us to understand in more details the boot duration of both virtualization techniques under various storage devices and resources contentions. Particularly, we analyzed thoroughly the boot time of VMs, Dockers on top of bare-metal servers, and Dockers inside VMs, which is a current trend of public Cloud Computing such as Amazon Web Services or Google Cloud. We developed a methodology that enables us to perform fully-automatized and reproducible experimental campaigns on a scientific testbed. Thanks to this methodology, we conducted more than 14.400 experiments on Grid’5000 testbed for a bit more than 500 hours. The results we collected provide an important information related to the boot time behavior of these two virtualization technologies. Although containers boot much faster than VMs, both containers and VMs boot time are impacted by the co-workloads on the same compute node.Si de nombreuses Ă©tudes se sont concentrĂ©es sur la rĂ©duction du temps nĂ©cessaire pour manipuler les images de machines virtuelles/conteneurs afin d’optimiser les opĂ©rations de provisionnement dans une infrastructure Cloud, seules quelques Ă©tudes ont examinĂ© le temps requis pour le dĂ©marage de ces systĂšmes. Plusieurs travaux antĂ©rieurs ont montrĂ© que l’ensemble du processus de dĂ©marrage peut durer de quelques secondes Ă  plusieurs minutes en fonction des charges de travail co-localisĂ©es et du nombre de machines dĂ©ployĂ©es simultanĂ©ment.Dans cet article, nous expliquons la mĂ©thodologie mise en place afin de conduire une grande campagne expĂ©rimentale sur les technologies de machines virtuelles et de conteneurs afin de comprendre plus en dĂ©tail l’impact des conflits d’accĂšs aux ressources tels que les pĂ©riphĂ©riques de stockage. En particulier, nous avons analysĂ© et comparĂ© le temps de dĂ©marrage des machines virtuelles, des conteneurs Docker hĂ©bergĂ©s sur des serveurs physiques et de ceux hĂ©bergĂ©s sur des serveurs virtualisĂ©s, ce dernier correspondant Ă  une tendance actuelle du Cloud Computing public tel qu’AmazonWeb Services ou Google Cloud Platform. Nous avons dĂ©veloppĂ© une mĂ©thodologie permettant de conduire des campagnes expĂ©rimentales entiĂšrement automatisables et facilement reproductibles sur une plateforme scientifique telle que l’infrastructure Grid’5000. GrĂące Ă  cette mĂ©thodologie, nous avons pu rĂ©aliser plus de 14400 expĂ©riences pour une durĂ©e totale d’un peu plus de 500 heures. Les rĂ©sultats que nous avons collectĂ©s fournissent des informations importantes sur le comportement au dĂ©marrage de ces deux technologies de virtualisation

    BlobCR: Virtual Disk Based Checkpoint-Restart for HPC Applications on IaaS Clouds

    Get PDF
    International audienceInfrastructure-as-a-Service (IaaS) cloud computing is gaining significant interest in industry and academia as an alternative platform for running HPC applications. Given the need to provide fault tolerance, support for suspend-resume and offline migration, an efficient Checkpoint-Restart mechanism becomes paramount in this context. We propose BlobCR, a dedicated checkpoint repository that is able to take live incremental snapshots of the whole disk attached to the virtual machine (VM) instances. BlobCR aims to minimize the performance overhead of checkpointing by persisting VM disk snapshots asynchronously in the background using a low overhead technique we call selective copy-on-write. It includes support for both application-level and process-level checkpointing, as well as support to roll back file system changes. Experiments at large scale demonstrate the benefits of our proposal both in synthetic settings and for a real-life HPC application

    YOLO: AccĂ©lĂ©ration du temps de dĂ©marrage de la machine virtuelleen rĂ©duisant les opĂ©rations d’I/O

    Get PDF
    Several works have shown that the time to boot one virtual machine (VM) can last up to a fewminutes in high consolidated cloud scenarios. This time is critical as VM boot duration defines how anapplication can react w.r.t. demands’ fluctuations (horizontal elasticity). To limit as much as possible thetime to boot a VM, we design the YOLO mechanism (You Only Load Once). YOLO optimizes the numberof I/O operations generated during a VM boot process by relying on the boot image abstraction, a subsetof the VM image (VMI) that contains data blocks necessary to complete the boot operation. Whenevera VM is booted, YOLO intercepts all read accesses and serves them directly from the boot image, whichhas been locally stored on fast access storage devices (e.g., memory, SSD, etc.). Creating boot imagesfor 900+ VMIs from Google Cloud shows that only 40 GB is needed to store all the mandatory data.Experiments show that YOLO can speed up VM boot duration 2-13 times under different resourcescontention with a negligible overhead on the I/O path. Finally, we underline that although YOLO hasbeen validated with a KVM environment, it does not require any modification on the hypervisor, theguest kernel nor the VM image (VMI) structure and can be used for several kinds of VMIs (in this study,Linux and Windows VMIs have been tested)Plusieurs travaux ont montrĂ© que le temps de dĂ©marrage d’une machine virtuelle (VM)peut s’étale sur plusieurs minutes dans des scĂ©narios fortement consolidĂ©s. Ce dĂ©lai est critique car ladurĂ©e de dĂ©marrage d’une VM dĂ©finit la rĂ©activitĂ© d’une application en fonction des fluctuations decharge (Ă©lasticitĂ© horizontale). Pour limiter au maximum le temps de dĂ©marrage d’une VM, nous avonsconçu le mĂ©canisme YOLO (You Only Load Once). YOLO optimise le nombre d’opĂ©rations “disque”gĂ©nĂ©rĂ©es pendant le processus de dĂ©marrage. Pour ce faire, il s’appuie sur une nouvelle abstractionintitulĂ©e “image de dĂ©marrage” et correspondant Ă  un sous-ensemble des donnĂ©es de l’image de la VM.Chaque fois qu’une machine virtuelle est dĂ©marrĂ©e, YOLO intercepte l’ensemble des accĂšs en lectureafin de les satisfaire directement Ă  partir de l’image de dĂ©marrage, qui a Ă©tĂ© stockĂ©e prĂ©alablement surdes pĂ©riphĂ©riques de stockage Ă  accĂšs rapide (par exemple, mĂ©moire, SSD, etc.). La crĂ©ation d’imagede dĂ©marrage pour les 900 types des VMs proposĂ©es sur l’infrastructure Cloud de Google reprĂ©senteseulement 40 Go, ce qui est une quantitĂ© de donnĂ©es qui peut tout Ă  fait ĂȘtre stockĂ©e sur chacundes noeuds de calculs. Les expĂ©riences rĂ©alisĂ©es montrent que YOLO permet accĂ©lĂ©rer la durĂ©e dedĂ©marrage d’un facteur allant de 2 Ă  13 selon les diffĂ©rents scĂ©narios de consolidation. Nous soulignonsque bien que YOLO ait Ă©tĂ© validĂ© avec un environnement KVM, il ne nĂ©cessite aucune modificatfionsur l’hyperviseur, le noyau invitĂ© ou la structure d’image de la VM et peut donc ĂȘtre utilisĂ© pourplusieurs types d’images (dans cette Ă©tude, nous testons des images Linux et Windows)

    Virtual Machine Lifecycle Management in Grid and Cloud Computing

    Get PDF
    Virtualisierungstechnologie ist die Grundlage fĂŒr zwei wichtige Konzepte: Virtualized Grid Computing und Cloud Computing. Ersteres ist eine Erweiterung des klassischen Grid Computing. Es hat zum Ziel, die Anforderungen kommerzieller Nutzer des Grid hinsichtlich der Isolation von gleichzeitig ausgefĂŒhrten Batch-Jobs und der Sicherheit der zugehörigen Daten zu erfĂŒllen. Dabei werden Anwendungen in virtuellen Maschinen ausgefĂŒhrt, um sie voneinander zu isolieren und die von ihnen verarbeiteten Daten vor anderen Nutzern zu schĂŒtzen. DarĂŒber hinaus löst Virtualized Grid Computing das Problem der Softwarebereitstellung, eines der bestehenden Probleme des klassischen Grid Computing. Cloud Computing ist ein weiteres Konzept zur Verwendung von entfernten Ressourcen. Der Fokus dieser Dissertation bezĂŒglich Cloud Computing liegt auf dem “Infrastructure as a Service Modell”, das Ideen des (Virtualized) Grid Computing mit einem neuartigen GeschĂ€ftsmodell kombiniert. Dieses besteht aus der Bereitstellung von virtuellen Maschinen auf Abruf und aus einem Tarifmodell, bei dem lediglich die tatsĂ€chliche Nutzung berechnet wird. Der Einsatz von Virtualisierungstechnologie erhöht die Auslastung der verwendeten (physischen) Rechnersysteme und vereinfacht deren Administration. So ist es beispielsweise möglich, eine virtuelle Maschine zu klonen oder einen Snapshot einer virtuellen Maschine zu erstellen, um zu einem definierten Zustand zurĂŒckkehren zu können. Jedoch sind noch nicht alle Probleme im Zusammenhang mit der Virtualisierungstechnologie gelöst. Insbesondere entstehen durch den Einsatz in den sehr dynamischen Umgebungen des Virtualized Grid Computing und des Cloud Computing neue Herausforderungen fĂŒr die Virtualisierungstechnologie. Diese Dissertation befasst sich mit verschiedenen Aspekten des Einsatzes von Virtualisierungstechnologie in Virtualized Grid und Cloud Computing Umgebungen. ZunĂ€chst wird der Lebenszyklus von virtuellen Maschinen in diesen Umgebungen untersucht, und es werden Modelle dieses Lebenszyklus entwickelt. Anhand der entwickelten Modelle werden Probleme identifiziert und Lösungen fĂŒr diese Probleme entwickelt. Der Fokus liegt dabei auf den Bereichen Speicherung, Bereitstellung und AusfĂŒhrung von virtuellen Maschinen. Virtuelle Maschinen werden ĂŒblicherweise in so genannten Disk Images, also Abbildern von virtuellen Festplatten, gespeichert. Dieses Format hat nicht nur Einfluss auf die Speicherung von grĂ¶ĂŸeren Mengen virtueller Maschinen, sondern auch auf deren Bereitstellung. In den untersuchten Umgebungen hat es zwei konkrete Nachteile: es verschwendet Speicherplatz und es verhindert eine effiziente Bereitstellung von virtuellen Maschinen. Maßnahmen zur Steigerung der Sicherheit von virtuellen Maschinen haben auf alle drei genannten Bereiche Einfluss. Beispielsweise sollte vor der Bereitstellung einer virtuellen Maschine geprĂŒft werden, ob die darin installierte Software noch aktuell ist. Weiterhin sollte die AusfĂŒhrungsumgebung Möglichkeiten bereitstellen, um die virtuelle Infrastruktur wirksam zu ĂŒberwachen. Die erste in dieser Dissertation vorgestellte Lösung ist das Konzept der Image Composition. Es beschreibt die Komposition eines kombinierten Disk Images aus mehreren Schichten. Dadurch können Teile der einzelnen Schichten, die von mehreren virtuellen Maschinen verwendet werden, zwischen diesen geteilt und somit der Speicherbedarf fĂŒr die Gesamtheit der virtuellen Maschinen reduziert werden. Der Marvin Image Compositor ist die Umsetzung dieses Konzepts. Die zweite Lösung ist der Marvin Image Store, ein Speichersystem fĂŒr virtuelle Maschinen, das nicht auf den traditionell genutzten Disk Images basiert, sondern die darin enthaltenen Daten und Metadaten auf eine effiziente Weise getrennt voneinander speichert. Weiterhin werden vier Lösungen vorgestellt, die die Sicherheit von virtuellen Maschine verbessern können: Der Update Checker ist eine Lösung, die es ermöglicht, veraltete Software in virtuellen Maschinen zu identifizieren. Dabei spielt es keine Rolle, ob die jeweilige virtuelle Maschine gerade ausgefĂŒhrt wird oder nicht. Die zweite Sicherheitslösung ermöglicht es, mehrere virtuelle Maschinen, die auf dem Konzept der Image Composition basieren, zentral zu aktualisieren. Das bedeutet, dass die einmalige Installation einer neuen Softwareversion ausreichend ist, um mehrere virtuelle Maschinen auf den neuesten Stand zu bringen. Die dritte Sicherheitslösung namens Online Penetration Suite ermöglicht es, virtuelle Maschinen automatisiert nach Schwachstellen zu durchsuchen. Die Überwachung der virtuellen Infrastruktur auf allen Ebenen ist der Zweck der vierten Sicherheitslösung. ZusĂ€tzlich zur Überwachung ermöglicht diese Lösung auch eine automatische Reaktion auf sicherheitsrelevante Ereignisse. Schließlich wird ein Verfahren zur Migration von virtuellen Maschinen vorgestellt, welches auch ohne ein zentrales Speichersystem eine effiziente Migration ermöglicht
    corecore