Analysis of the claims data of a life insurance portfolio

Abstract

Mestrado em Ciências ActuariaisA graduação de mortalidade é um problema há muito estudado nas ciências atuariais, utilizando muitas abordagens diferentes. Para este estudo, vamos focar-nos em alguns exemplos específicos de graduação: a lei de Gompertz's; uma abordagem empírica em que as taxas de mortalidade são ajustadas a uma exponencial; graduação por tábua de mercado; modelos lineares generalizados; três tipos diferentes de árvores de regressão - árvores de classificação e regressão, árvores de inferência condicional e florestas aleatórias. Além disso, seguindo (Guo et al., 2002), serão propostos métodos híbridos, alguns dos quais ainda não existiam na literatura, combinando árvores de regressão e as outras técnicas. Todos estes modelos serão aplicados tanto ao conceito tradicional de taxa de mortalidade como a uma sua versão ponderada por capital seguro. De acordo com o esperado e a literatura, a mortalidade será mais baixa para apólices com capital seguro maior, o que vai de encontro à ideia de que pessoas com maior capital seguro estarão numa situação económica mais favorável e conseguirão viver mais tempo. Para este estudo, idade, género, estado civil e local de residência foram utilizados como como variáveis explicativas. Estas variáveis explicativas revelaram-se importantes quando aplicados modelos de árvores de regressão. Conclui-se que para qualquer uma das taxas de mortalidade estudadas o melhor modelo correspondeu a um modelo híbrido que combina uma árvore de regressão com a abordagem empírica aplicada às suas folhas. Como métrica de comparação foi utilizado o RMSE (raiz quadrada do erro quadrático médio).Mortality graduation is a problem that has long been studied in actuarial science using many different approaches. In this thesis, we will focus on a number of specific examples of techniques for graduation: Gompertz's law; an empirical approach where mortality rates are fit to an exponential; graduation by standard table; generalised linear models (GLM); three different types of regression trees - classification and regression trees, conditional inference trees and random forests. Furthermore, following (Guo et al., 2002), hybrid methods will be created, some of which unseen before in the literature, combining regression trees with some of the other approaches. These techniques will be applied to the traditional concept of mortality rate but also to a version of it weighted by sum assured. As expected and previously observed in literature, mortality will generally be lighter for policies with higher sum assured, which is in line with the idea that people with higher sums assured are wealthier and hence healthier, living longer. For this study, age, gender, civil status and place of residence were used as explanatory variables. These explanatory variables proved relevant when applying the tree generating algorithms. In the end, we will find that both for the traditional and the weighted mortality rates, a hybrid method (of a regression tree with the empirical approach applied to its leafs) yielded the best results for the portfolio in study. The RMSE (root mean square error) was the evaluation metric used

    Similar works