20 research outputs found

    Individuals tell a fascinating story: using unsupervised text mining methods to cluster policyholders based on their medical history

    Get PDF
    Background and objective: Classifying people according to their health profile is crucial in order to propose appropriate treatment. However, the medical diagnosis is sometimes not available. This is for example the case in health insurance, making the proposal of custom prevention plans difficult. When this is the case, an unsupervised clustering method is needed. This article aims to compare three different methods by adapting some text mining methods to the field of health insurance. Also, a new clustering stability measure is proposed in order to compare the stability of the tested processes. Methods : Nonnegative Matrix Factorization, the word2vec method, and marginalized Stacked Denoising Autoencoders are used and compared in order to create a high-quality input for a clustering method. A self-organizing map is then used to obtain the final clustering. A real health insurance database is used in order to test the methods. Results: the marginalized Stacked Denoising Autoencoder outperforms the other methods both in stability and result quality with our data. Conclusions: The use of text mining methods offers several possibilities to understand the context of any medical act. On a medical database, the process could reveal unexpected correlation between treatment, and thus, pathology. Moreover, this kind of method could exploit the refund dates contained in the data, but the tested method using temporality, word2vec, still needs to be improved since the results, even if satisfying, are not as better as the one offered by other methods

    Health-policyholder clustering using health consumption: a useful tool for targeting prevention plans

    Get PDF
    On paper, prevention appears to be a good complement to health insurance. However, its implementation is often costly. To maximize the impact and efficiency of prevention plans these should target particular groups of policyholders. In this article, we propose a way of clustering policyholders that could be a starting point for the targeting of prevention plans. This two-step method mainly classifies using policyholder health consumption. This dimension is first reduced using a Nonnegative matrix factorization algorithm, producing intermediate health-product clusters. We then cluster using Kohonen's map algorithm. This leads to a natural visualization of the results, allowing the simple comparison of results from different databases. We apply our method to two real health-insurer datasets. We carry out a number of tests (including tests on a text-mining database) of method stability and clustering ability. The method is shown to be stable, easily-understandable, and able to cluster most policyholders efficiently

    Optimal prevention strategies in the classical risk model

    Get PDF
    International audienceIn this paper, we propose and study a first risk model in which the insurer may invest into a prevention plan which decreases claim intensity. We determine the optimal prevention investment for different risk indicators. In particular, we show that the prevention amount minimizing the ruin probability maximizes the adjustment coefficient in the classical ruin model with prevention, as well as the expected dividends until ruin in the model with dividends. We also show that the optimal prevention strategy is different if one aims at maximizing the average surplus at a fixed time horizon. A sensitivity analysis is carried out. We also prove that our results can be extended to the case where prevention starts to work only after a minimum prevention level threshold

    Optimal prevention of large risks with two types of claims

    Get PDF
    In this paper, we propose and study a risk model with two types of claims in which the insurer may invest into a prevention plan which decreases the large claims intensity without impacting the small claims. In this setting, we prove that prevention is advantageous when claim severities for small and large claims are ordered in the sense of the Harmonic-Mean-Residual-Lifetime (HMRL) order. In addition, we show that the optimal prevention amount is the lowest when there is no initial surplus. Finally, we characterize the asymptotic optimal prevention strategy when the initial surplus tends to infinity in the two main cases where both claim types are light-tailed and where one of them is light-tailed and the other one is heavy-tailed

    La psychiatrie : un risque important en assurance santé ?

    Get PDF
    The French Social Security has highlighted psychiatric diseases as a major risk. However, French private health insurance companies do not consider psychiatric care as an important topic. In this article is presented a study (based on four real health insurance databases) of the cost of a policyholder benefiting from a psychiatric follow-up care. It aims to provide a better understanding of this risk in an insurance context. It is shown that such a policyholder costs twice as much as an average policyholder, notably due to important expenses in hospitalization. Policyholders aged from 15 to 30 years, as well as the ones over 70 years old are the most concerned by this risk.La psychiatrie a été identifiée par la Sécurité Sociale comme un enjeu majeur. Pourtant, celle-ci n'est pas identifiée comme un risque important par les organismes d'assurance santé complémentaire, si bien qu'aucune étude n'a été publiée en France sur sa prise en charge en dehors de l'Assurance Maladie. Cet article présente le résultat de travaux réalisés à partir de quatre bases de données regroupant les prestations versées par des complémentaires santé. L'objectif de cette analyse consiste à mieux comprendre ce risque et évaluer son coût pour les complémentaires santé. Cette étude permet de conclure qu'un assuré identifié comme étant suivi par un psychiatre présente un coût médical à la charge de l'assureur deux fois supérieur à celui d'un assuré moyen, notamment à cause de fortes dépenses en hospitalisation non psychiatrique. Les personnes ayant entre 15 et 30 ans et les séniors sont les plus concernés par ce risque

    Contribution to the study of prevention for an insurance company

    No full text
    Cette thèse porte sur la mise en place d’actions de prévention financées par une compagnie d’assurance. Elle est composée de cinq chapitres précédés d’une introduction générale qui a pour vocation de présenter les difficultés liées à la prévention, les outils utilisés et les principaux résultats obtenus. Le chapitre 1 propose une méthode de classification non supervisée d’assurés santé par groupes de risques homogènes, à partir des prestations versées par un organisme assureur. Cette méthode comporte deux phases : une réduction de dimension des données à l’aide de factorisations de matrice positive (NMF) est d’abord effectuée. La classification est ensuite finalisée à l’aide des cartes de Kohonen. Les tests de la méthode, sont aussi présentés. Les classes finales obtenues sont finalement analysées afin d’étudier si certaines d’entre elles peuvent faire l’objet d’une action de prévention. Une action de prévention sur la psychiatrie est proposée. Le chapitre 2 est la continuité du chapitre 1 puisqu’il s’attache à comparer la qualité de la réduction de dimension à l’aide des méthodes NMF avec celle obtenue grâce à deux autres méthodes, les méthodes Word2Vec (W2V) et les autoencodeurs débruiteurs empilés marginalisés (mSDA). Notamment, la stabilité des classifications finales est étudiée à l’aide d’une nouvelle mesure de stabilité. Un complément sur la prise en compte de la temporalité avec l’algorithme W2V est également présenté. Le chapitre 3 propose une étude du risque psychiatrie au sein d’un organisme complémentaire santé, les algorithmes des chapitres précédent ayant permis d’identifier ce risque. A l’aide d’une étude statistique menée sur quatre bases de données, il est notamment montré que les assurés consommant de la psychiatrie coûtent en moyenne deux fois plus cher à l’assureur santé qu’un individu moyen. Quelques actions de prévention potentielles sont suggérées en conclusion. Le chapitre 4 s’intéresse à la modélisation de la prévention au sein d’une compagnie d’assurance. En intégrant un paramètre de prévention au sein du modèle Poisson composé issu de la théorie de la ruine, il est en effet possible de mesurer l’effet de la prévention sur certains indicateurs, comme la probabilité de ruine. Différentes stratégies optimales de prévention sont proposées, et une analyse de sensibilité est fournie. Enfin, le chapitre 5 propose d’étendre le modèle considéré dans le chapitre précédent au cas où une compagnie d’assurance est confrontée à un risque léger et à un risque lourd. Dans un tel modèle, la stratégie optimale de prévention dépend des montants de réserves constituées. Des résultats asymptotiques sur les stratégies optimales sont fournisIn this PhD thesis is studied the implementation of an insurance program by a private insurance company. The manuscript starts with a general introduction, where are presented the difficulties linked to this topic along with the main results and the technical tools used in the other chapters. In Chapter 1 is described a health policyholders clustering process. This method use the individual health spending in order to create homogeneous risk clusters. The whole process is in two steps : a dimension reduction is first performed using a Nonnegative Matrix Factorization (NMF) algorithm, preceding a clustering made using the Kohonen’s map method. The validation process of this method is also presented. It includes tests done on a text corpus database. Final clusters are analysed in order to be allow a better understanding of their makeup. Chapter 2 completes Chapter 1 by challenging NMF dimension reduction algorithm with two alternative methods : Word2Vec (W2V) and the marginalized Stacked Denoising Autoencoders (mSDA). The final cluster stability is studied using a new stability measure. The ability to tackle the temporality of the Word2Vec algorithm is also considered. In Chapter 3 is studied the psychiatric risk for an health insurer. A statistical analysis of 4 database is made. It is shown that in France, someone receiving refunds for a psychiatric spending costs overall 2.5 times more than the average policyholder. Potential prevention actions are proposed to conclude this Chapter. In Chapter 4 is presented a way to model the impact of a prevention program for an insurance company. This model is based on the addition of a prevention parameter into the compound Poisson model. It is then possible to study the prevention effect on some chosen indicators, such a ruin probability. Two optimal prevention strategies are presented, and a sensibility analysis is provided. In Chapter 5 is proposed an extension of the model presented in Chapter 4. The insurance company is now supposed to face two different risk, a light one and a heavy one. In such a model, the optimal strategy is depending of the initial reserve amounts. Some asymptotic results on optimal strategies are provide

    Contribution à l'étude de la prévention en assurance santé

    No full text
    In this PhD thesis is studied the implementation of an insurance program by a private insurance company. The manuscript starts with a general introduction, where are presented the difficulties linked to this topic along with the main results and the technical tools used in the other chapters. In Chapter 1 is described a health policyholders clustering process. This method use the individual health spending in order to create homogeneous risk clusters. The whole process is in two steps : a dimension reduction is first performed using a Nonnegative Matrix Factorization (NMF) algorithm, preceding a clustering made using the Kohonen’s map method. The validation process of this method is also presented. It includes tests done on a text corpus database. Final clusters are analysed in order to be allow a better understanding of their makeup. Chapter 2 completes Chapter 1 by challenging NMF dimension reduction algorithm with two alternative methods : Word2Vec (W2V) and the marginalized Stacked Denoising Autoencoders (mSDA). The final cluster stability is studied using a new stability measure. The ability to tackle the temporality of the Word2Vec algorithm is also considered. In Chapter 3 is studied the psychiatric risk for an health insurer. A statistical analysis of 4 database is made. It is shown that in France, someone receiving refunds for a psychiatric spending costs overall 2.5 times more than the average policyholder. Potential prevention actions are proposed to conclude this Chapter. In Chapter 4 is presented a way to model the impact of a prevention program for an insurance company. This model is based on the addition of a prevention parameter into the compound Poisson model. It is then possible to study the prevention effect on some chosen indicators, such a ruin probability. Two optimal prevention strategies are presented, and a sensibility analysis is provided. In Chapter 5 is proposed an extension of the model presented in Chapter 4. The insurance company is now supposed to face two different risk, a light one and a heavy one. In such a model, the optimal strategy is depending of the initial reserve amounts. Some asymptotic results on optimal strategies are providedCette thèse porte sur la mise en place d’actions de prévention financées par une compagnie d’assurance. Elle est composée de cinq chapitres précédés d’une introduction générale qui a pour vocation de présenter les difficultés liées à la prévention, les outils utilisés et les principaux résultats obtenus. Le chapitre 1 propose une méthode de classification non supervisée d’assurés santé par groupes de risques homogènes, à partir des prestations versées par un organisme assureur. Cette méthode comporte deux phases : une réduction de dimension des données à l’aide de factorisations de matrice positive (NMF) est d’abord effectuée. La classification est ensuite finalisée à l’aide des cartes de Kohonen. Les tests de la méthode, sont aussi présentés. Les classes finales obtenues sont finalement analysées afin d’étudier si certaines d’entre elles peuvent faire l’objet d’une action de prévention. Une action de prévention sur la psychiatrie est proposée. Le chapitre 2 est la continuité du chapitre 1 puisqu’il s’attache à comparer la qualité de la réduction de dimension à l’aide des méthodes NMF avec celle obtenue grâce à deux autres méthodes, les méthodes Word2Vec (W2V) et les autoencodeurs débruiteurs empilés marginalisés (mSDA). Notamment, la stabilité des classifications finales est étudiée à l’aide d’une nouvelle mesure de stabilité. Un complément sur la prise en compte de la temporalité avec l’algorithme W2V est également présenté. Le chapitre 3 propose une étude du risque psychiatrie au sein d’un organisme complémentaire santé, les algorithmes des chapitres précédent ayant permis d’identifier ce risque. A l’aide d’une étude statistique menée sur quatre bases de données, il est notamment montré que les assurés consommant de la psychiatrie coûtent en moyenne deux fois plus cher à l’assureur santé qu’un individu moyen. Quelques actions de prévention potentielles sont suggérées en conclusion. Le chapitre 4 s’intéresse à la modélisation de la prévention au sein d’une compagnie d’assurance. En intégrant un paramètre de prévention au sein du modèle Poisson composé issu de la théorie de la ruine, il est en effet possible de mesurer l’effet de la prévention sur certains indicateurs, comme la probabilité de ruine. Différentes stratégies optimales de prévention sont proposées, et une analyse de sensibilité est fournie. Enfin, le chapitre 5 propose d’étendre le modèle considéré dans le chapitre précédent au cas où une compagnie d’assurance est confrontée à un risque léger et à un risque lourd. Dans un tel modèle, la stratégie optimale de prévention dépend des montants de réserves constituées. Des résultats asymptotiques sur les stratégies optimales sont fourni

    Optimal prevention of large risks with two types of claims

    No full text
    In this paper, we propose and study a risk model with two types of claims in which the insurer may invest into a prevention plan which decreases the intensity of large claims without impacting the small claims. We identify a necessary and sufficient condition for insurers to use prevention if there is no surplus. If, in addition, the severity of large claims dominates that of small claims by the harmonic mean residual life (HMRL) order, insurers invest more in prevention in the presence of a surplus. Finally, we characterize the asymptotic optimal prevention strategy when the initial surplus tends to infinity in the two main cases where both claim types are light-tailed and where one of them is light-tailed and the other one is heavy-tailed.SCOPUS: ar.jinfo:eu-repo/semantics/publishe
    corecore