Modelling of low probability high impact events

Abstract

In vielen Problemstellungen ist es erforderlich Verluste zu modellieren, verursacht durch den zugrundeliegenden Prozess, der eine große Anzahl von Ereignissen mit geringer Verlusthöhe und wenige Ereignisse mit sehr hohen Verlusten erzeugt. Prominente Beispiele sind Naturkatastrophen (wie beispielsweise Erdbeben, Wirbelstürme, Tornados), Betriebsverluste in stark regulierten Institutionen oder Versicherungsfälle. In jedem Fall kann die Gesamtverlustverteilung mit einer sogenannten zusammengesetzten Verteilung modelliert werden, bei der zwei getrennte Verteilungen zusammengeführt werden, die die Anzahl der Ereignisse und ihre Verlusthöhe beschreiben. Letzteres kann weiter in das empirische Verteilungszentrum und den Verteilungsrand aufgeteilt werden. Diese Unterscheidung erlaubt die Modellierung der Aspekte hoher Wahrscheinlichkeit mit geringer Auswirkung und niedriger Wahrscheinlichkeit mit hoher Auswirkung der zugrunde liegenden Daten mittels einer empirischen Verteilungsfunktion bzw. einer kontinuierlichen Verteilung, die jeweils durch das Glivenko-Cantelli-Theorem und der Extremwerttheorie gerechtfertigt sind. Das entwickelte Model wird dann auf eine Untersuchung der jährlichen Gesamtverluste durch Tornados in den Vereinigten Staaten von 1988 bis 2017 angewendet. Basierend auf theoretischen Überlegungen und statistischen Nachweisen wird die generalisierte Pareto-Verteilung gewählt. Dies wird dann mit der "minimum distance estimation" Methode mittels der Anderson-Darling-Distanz kalibriert. Die Häufigkeitsanalyse zeigt, dass die negative Binomialverteilung eine gute Beschreibung der jährlichen Tornado-Zählungen liefert. Die daraus resultierende zusammengesetzte negativ Binomial Verteilung bietet eine realistische Beschreibung der jährlichen Verlustereignisse und kann um saisonale und räumliche Effekte erweitert werden.In many real world phenomena the need for modelling of losses caused by an underlying process that generates both large number of occurrences with minor losses and occurrences with severe impact exists. Prominent examples are natural disasters (earthquakes, hurricanes, tornadoes etc.), operational losses in highly regulated institutions or claims generated by an insurance policy. In each case, the aggregated loss distribution can be modelled with a so called compound model that is a combination of two separate distributions describing the number of events and their severities. The latter can be further split into the empirical body and tail. This distinction allows the modelling of the high-probability-low impact and low-probability-high-impact aspects of the underlying data with an empirical distribution function and a continuous distribution as justified by the Glivenko–Cantelli theorem and the extreme value theory, respectively. The developed model is then applied to a study of yearly total losses caused by tornadoes in the United States from 1988 till 2017. Based on theoretical considerations and empirical evidence the Generalized Pareto Distribution is chosen to model tail events separated from the empirical body by a threshold of $50M. It is then calibrated applying the minimum distance estimation with the Anderson-Darling distance. The frequency analysis reveals that the negative binomial distribution provides a good fit of yearly tornado counts. The resulting compound negative binomial model provides a realistic description of yearly loss events and can be further extended to include seasonal and spatial effects

    Similar works

    Full text

    thumbnail-image

    Available Versions