5 research outputs found

    Implementation of a NFV monitoring system for reactive environments

    Get PDF
    This work aims at researching the existent solutions of monitoring and alerting techniques, as well as defining a suitable architecture, design and implementation of a complete and customizable monitoring and alerting framework used to inspect and notify specific conditions on dynamically instantiated applications operating in the network. Such Network Services (NS) are used in the Network Function Virtualization (NFV) architecture, allowing rapid instantiation and configuration of virtualized environments that handle network configuration. This design and implementation seek to provide more flexibility and dynamicity to the network operator to monitor custom or generic metrics and trigger notifications based on custom thresholds, without depending on the Virtual Network Function (VNF) developer to adapt its descriptor and onboard each version into the NFV Orchestrator (NFVO) prior to each usage. The framework here developed follows a modular architecture that separates the monitoring and alerting policies from the onboarding and instantiation process of the Network Functions. The architecture also facilitates the integration with other systems and adapting the functionality of an operational environment thanks to its decoupled and modular approach. The presented work considers a monitoring and alerting framework that is especially useful for dynamic environments such as those relying in NFV, like those in the EU H2020 PALANTIR project. There, the framework is used to help assessing the correct behavior of the Security NSs that are used to prevent or mitigate security anomalies in the network of each client. If abnormalities are found, remediation measures will take place to replace the potentially compromised NS instances with clean, appropriate ones.Objectius de Desenvolupament Sostenible::9 - Indústria, Innovació i Infraestructur

    Fusing Information from Tickets and Alerts to Improve the Incident Resolution Process

    Get PDF
    In the context of network incident monitoring, alerts are useful notifications that provide IT management staff with information about incidents. They are usually triggered in an automatic manner by network equipment and monitoring systems, thus containing only technical information available to the systems that are generating them. On the other hand, ticketing systems play a different role in this context. Tickets represent the business point of view of incidents. They are usually generated by human intervention and contain enriched semantic information about ongoing and past incidents. In this article, our main hypothesis is that incorporating tickets information into the alert correlation process will be beneficial to the incident resolution life-cycle in terms of accuracy, timing, and overall incident’s description. We propose a methodology to validate this hypothesis and suggest a solution to the main challenges that appear. The proposed correlation approach is based on the time alignment of the events (alerts and tickets) that affect common elements in the network. For this we use real alert and ticket datasets obtained from a large telecommunications network. The results have shown that using ticket information enhances the incident resolution process, mainly by reducing and aggregating a higher percentage of alerts compared with standard alert correlation systems that only use alerts as the main source of information. Finally, we also show the applicability and usability of this model by applying it to a case study where we analyze the performance of the management staff

    Maßnahmen zur Sicherung von E2E-QoS bei Verketteten Diensten

    Get PDF
    Die meisten internationalen und oft auch nationalen Netzverbindungen sind als horizontal gekoppelte Teildienste realisiert, die von mehreren Service Providern (SPs) erbracht werden. Die Ende-zu-Ende (E2E) Dienstgüte (engl. Quality of Service, QoS) setzt sich aus der Güte der involvierten Teildienste zusammen. In Bezug auf die E2E-QoS haben sich zwischen den SPs zwei Herangehensweisen etabliert: für die garantierte E2E-Dienstgüte werden üblicherweise hierarchische Organisationsbeziehungen aufgebaut, bei einer Gleichberechtigung der beteiligten Provider (was bei Internet- und Telefonverbindungen häufig der Fall ist) hat sich die sog. Best-Effort-Strategie durchgesetzt. Durch die Anforderungen der modernen internationalen Forschungsprojekte und der neuartigen kundenorientierten Dienste ist nun der Bedarf entstanden, die E2E-QoS bei Netzverbindungen auch dann zu garantieren, wenn der Aufbau hierarchischer Organisationsbeziehungen aus diversen Gründen nicht möglich ist. % Die Dienstklasse, die die angesprochenen technischen und organisatorischen Eigenschaften in sich vereint, wird in dieser Arbeit als Verkettete Dienste (engl.: Concatenated Services) referenziert. Um die Anforderungen für die zu entwickelnde Lösung zu bestimmen, werden in dieser Arbeit die Interessen unterschiedlicher Akteure in verschiedenen Verbindungsdiensten analysiert. Eine darauffolgende Untersuchung von existierenden Lösungen in relevanten Forschungsbereichen liefert eine Reihe von möglichen Lösungsbausteinen und lehrreichen Erfahrungen, die bei der Konzeption der eigentlichen Lösung berücksichtigt werden. Die entwickelte Lösung besteht aus drei Teilen. Der Kern der Lösung ist durch die SLM-aware Routing-Architektur gegeben. In der entwickelten Lösung werden während des Routings nicht nur der Pfadverlauf, sondern auch die QoS-Anforderungen und die benötigte Managementfunktionalität aller involvierten Teildienste bestimmt. Durch die Bestimmung der Akteure, die die benötigten Rollen übernehmen sollen, sowie der Kommunikationswege zwischen Managementkomponenten wird die Durchführung von Service-Level-Management (SLM) in allen Lebenszyklusphasen ermöglicht. Die Integrationsrolle zwischen den SPs wird von dem Kommunikationsprotokoll übernommen. Das Protokoll ist sowohl für die Signalisierung als auch für den Informationsaustausch während des kompletten Dienstinstanz-Lebenszyklus zuständig. Die mit den erlaubten Signalen assoziierten Basisprozesse erlauben eine unmissverständliche und intuitive Definition des erwarteten Verhaltens. Die Definition von Referenzprozessen für Service Level Management bei Verketteten Diensten rundet die entwickelte Lösung ab. Die SLM-Prozesse bauen ausschließlich auf dem zuvor definierten Kommunikationsprotokoll auf, wodurch eine leichte Anpassbarkeit dieser Prozesse an zusätzliche Anforderungen gewährleistet wird. Die Funktionsweise der entwickelten Lösung wird an einem detaillierten Beispiel illustriert. Die Güte der Lösung wird anhand der Erfahrungen mit der Integration der Lösungsteile in verschiedenen Forschungsprojekten sowie anhand der aufgestellten Anforderungen bewertet. Ein kurzer Ausblick auf die Weiterentwicklungsmöglichkeiten und auf verwandte Forschungsfragestellungen schließt diese Arbeit ab

    XSEDE: The Extreme Science and Engineering Discovery Environment (OAC 15-48562) Interim Project Report 13: Report Year 5, Reporting Period 2 August 1, 2020 – October 31, 2020

    Get PDF
    This is the Interim Project Report 13 (IPR13) for the NSF XSEDE project. It includes Key Performance Indicator data and project highlights for Reporting Year 5, Report Period 2 (August 1-October 31, 2020).NSF OAC 15-48562Ope