Simulation-based evaluation of a fault-tolerant IP communication system

Abstract

Zsfassung in dt. Sprache. - Literaturverz. S. 103 - 106Mit dem wachsenden Anwendungsgebiet der Automation verändern sich auch die Anforderungen, die an ein Automatisierungssystem und dessen Kommunikationssystem gestellt werden. Vor allem bei sicherheitskritischen Systemen ist eine zuverlässige Kommunikation unerlässlich, da ein Fehlverhalten des Systems schwerwiegende Folgen haben kann, wie etwa lebensbedrohliche Situationen oder immense Kosten. Die Zuverlässigkeit von Kommunikationssystemen kann durch das Anwenden von Fehlertoleranz erhöht werden. Diese stellt die Funktionsfähigkeit eines Systems auch bei Auftreten einer Fehlerursache sicher und wird durch eine redundante Ausführung von Komponenten realisiert. Im Bereich der Datenkommunikation wird diese grundsätzlich durch Hardware-Redundanz in Form von redundanten Verbindungen umgesetzt. Auf Grund redundanter Pfade in einem solchen Netzwerk, muss ein sogenanntes "network protection and recovery" Protokoll eingesetzt werden. Mit der Bedeutungszunahme des Internets halten Netzwerktechnologien wie Ethernet oder IP auch in die Automation Einzug. Allerdings müssen in diesem Bereich auch verschiedene Einschränkungen und zusätzliche Anforderungen wie eine geringe Bandbreite oder spezielle zeitliche Bedingungen berücksichtigt werden. Viele der verfügbaren fehlertoleranten Kommunikationssysteme sind für den Einsatz in Netzwerken mit sehr hohen Bandbreiten und wenigen Netzwerkteilnehmern konzipiert. Die vorliegende Arbeit bietet einen Überblick über die aktuellesten Protokolle. Basierend darauf wird ein wichtiges Protokoll, das auf einer Ringtopologie basiert, detailliert untersucht. Nachdem dieses System für eine formale Analyse zu komplex ist und keine Möglichkeit besteht, seine Skalierbarkeit in einer realen Umgebung zu untersuchen, wird eine Simulationsstudie durchgeführt. Das betrachtete System basiert auf Ethernet, wobei die Datenkommunikation über IP gehandhabt wird. Darüber hinaus bietet das System mehrere Serviceklassen, die eine Priorisierung der Daten ermöglichen. Als protection and recovery Protokoll wird das MRP, ein in der Industrieautomation etabliertes Protokoll, ausgewählt. Das Verhalten dieses Kommunikationssystems wird in dieser Arbeit unter speziellen Einschränkungen, die sich aus halb-duplex Verbindungen mit einer Bandbreite von kleiner als 1Mbps ergeben, analysiert. Für die Simulationsstudie wird die diskrete, ereignisorientierte Simulationsumgebung OMNeT++ und das dazugehörige Framework INET verwendet. Dabei wird das Kommunikationssystem - und im Zuge dessen auch der Standard MRP - im INET Framework implementiert. Im Anschluß wird durch verschiedene Experimente die Skalierbarkeit des Systems, sowie die zeitliche und räumliche Verteilung der Netzwerkauslastung in Ringtopologien untersucht. Zusätzlich wird eruiert, wie sich verschiedene Modelle von ARP auf die Netzwerkleistung auswirken. Neben den Ergebnissen aus den Simulationsstudien liefert diese Arbeit mögliche Verbesserungen des MRP für den Einsatz in Ethernet basierten Netzwerken mit sehr langsamen Verbindungen.Automation finds an ever increasing scope of application. Consequently, automation systems and the communication systems deployed within them have to meet new requirements. In safety critical environments, reliable communication is essential in order to prevent situations with severe consequences, like life-threatening scenarios or costly damages. To increase the reliability of communication systems, the concept of fault tolerance can be applied, which enables the system to continue its operation even in the presence of a fault. This is basically achieved by hardware redundancy like redundant links in the context of data communication. Networks with redundant paths entail the necessity of a network protection and recovery protocol. Due to the increasing importance of the Internet, network technologies such as Ethernet and IP find their way even into the automation domain. However, different restrictions and additional demands, such as limited network bandwidth and special real-time requirements, have to be considered in this context. Although many different fault-tolerant communication technologies are available, they are mainly intended for use in high-performance communication systems with a limited number of network nodes. The present work provides an overview of the state of the art of such protocols. Subsequently, an important representative, which is based on a ring topology, is investigated. Since such a system is too complex for a formal analysis and the scalability cannot be examined in a real scenario, a simulation-based approach is used. The communication system under investigation operates at Data Link Layer and is based on Ethernet, the data exchange is based on IP. It offers further Quality of Service mechanisms to categorize the data traffic. The simulation studies are based on networks which consist of links with a bandwidth of less than 1Mbps, operating in half duplex mode. The Media Redundancy Protocol (MRP), a protocol established in the field of industrial automation, is selected and examined under the restrictive conditions stated above. The simulation studies are performed with the discrete-event simulation environment OMNeT++ in combination with the INET framework, which is extended by an MRP model especially programmed for the purpose of this study. The investigations explore the scalability of MRP with various parameter values and the spatial and temporal distribution of the network utilization. Additionally, experiments show how different implementations of ARP influence the network performance. Beyond the results of the simulation, the analysis of the MRP discovers possible improvements for low-speed Ethernet connections.10

    Similar works

    Full text

    thumbnail-image

    Available Versions