Article thumbnail
Location of Repository

LoneStar : Design and evaluation of an energy-efficient, disk-based archival storage system

By Matthias Grawinkel

Abstract

Bandlaufwerke waren bisher die vorherrschende Technologie, um die anfallenden Datenmengen in Archivsystemen zu speichern. Mit Zugriffsmustern, die immer aktiver werden, und Speichermedien wie Festplatten die kostenmäßig aufholen, muss die Architektur vor Speichersystemen zur Archivierung neu überdacht werden. Zuverlässigkeit, Integrität und Haltbarkeit sind die Haupteigenschaften der digitalen Archivierung. Allerdings nimmt auch die Zugriffsgeschwindigkeit einen erhöhten Stellenwert ein, wenn aktive Archive ihre gesamten Inhalte für den direkten Zugriff bereitstellen. Ein band-basiertes System kann die hierfür benötigte Parallelität, Latenz und Durchsatz nicht liefern, was in der Regel durch festplattenbasierte Systeme als Zwischenspeicher kompensiert wird.rnIn dieser Arbeit untersuchen wir die Herausforderungen und Möglichkeiten ein festplattenbasiertes Speichersystem zu entwickeln, das auf eine hohe Zuverlässigkeit und Energieeffizienz zielt und das sich sowohl für aktive als auch für kalte Archivumgebungen eignet. Zuerst analysieren wir die Speichersysteme und Zugriffsmuster eines großen digitalen Archivs und präsentieren damit ein mögliches Einsatzgebiet für unsere Architektur. Daraufhin stellen wir Mechanismen vor um die Zuverlässigkeit einer einzelnen Festplatte zu verbessern und präsentieren sowie evaluieren einen neuen, energieeffizienten, zwei- dimensionalen RAID Ansatz der für „Schreibe ein Mal, lese mehrfach“ Zugriffe optimiert ist. Letztlich stellen wir Protokollierungs- und Zwischenspeichermechanismen vor, die die zugrundeliegenden Ziele unterstützen und evaluieren das RAID System in einer Dateisystemumgebung.Tape has been the predominant storage target for digital archives, but with workloads becoming more active and storage media like hard disk drives catching up on costs-per-byte, the archival storage stack needs to be reinvestigated. Reliability, integrity, and durability are the main goals of digital preservation, but the role of performance increases with active archives that provide near-online access to all stored data. A tape-only solution can not deliver the required parallelism, latencies, and throughput, which leads to disk-based caches as compensation.rnIn this thesis, we explore the challenges and opportunities of building a hard disk drive based storage system that aims to be highly reliable and energy efficient and is suited for active archives as well as cold storage environments. First, we analyze the storage land- scape and access behavior of a large digital archive to present a use case for the proposed architecture. Then, we develop mechanisms to improve the reliability of a single disk drive and propose and evaluate a new energy efficient two-dimensional RAID scheme that is optimized for “write once, read sometimes” workloads. Finally, we present journaling and caching schemes that support the underlying goals and evaluate the RAID scheme in a file system environment

Topics: Archiv, Festplatte, Speichersystem, Archival, HDD, Storage System, Data processing Computer science
Publisher: 08: Physik, Mathematik und Informatik. 08: Physik, Mathematik und Informatik
Year: 2015
OAI identifier: oai:ubm.opus.hbz-nrw.de:4050
Download PDF:
Sorry, we are unable to provide the full text but you may find it at the following location(s):
  • http://ubm.opus.hbz-nrw.de/dok... (external link)
  • http://ubm.opus.hbz-nrw.de/vol... (external link)
  • Suggested articles


    To submit an update or takedown request for this paper, please submit an Update/Correction/Removal Request.