Machine Learning para la estimación del riesgo de crédito en una cartera de consumo

Abstract

Las entidades financieras por su naturaleza de negocio se encuentran inherentemente expuestas al riesgo de crédito, por ello, están continuamente en búsqueda de nuevas formas para medir la probabilidad de incumplimiento de los clientes que solicitan un crédito. Esta investigación tiene como objetivo comparar la precisión de un modelo de regresión logística frente a algunos modelos de Machine Learning, para la estimación del riesgo de crédito en una cartera de consumo; dichas metodologías se perfilan como una herramienta clave para la estimación de riesgos, debido a su flexibilidad y capacidad de aprendizaje. Para ello, se utilizaron los modelos de Regresión logística, Random Forest, Support Vector Machine y Multi-layer Perceptron, haciendo una comparación en la eficiencia de la estimación de los clientes que van a entrar en mora, y obteniendo como resultado que el modelo más equilibrado al momento de la evaluación es el Random Forest, dado que fue el que presentó el mejor ajuste de acuerdo con las métricas de exactitud evaluadas.Financial entities, due to their business nature, are inherently exposed to credit risk, for this reason, they are continually searching for new ways to measure the probability of default of clients requesting a loan. This research aims to comparing the precision of a logistic regression model against basic Machine Learning models for estimating credit risk in a consumer loan portfolio, these methodologies are emerging as a key tool for estimating risks due to their flexibility and learning capacity. For this, the Logistic Regression, Random Forest, Support Vector Machine and Multilayer Perceptron models were used, making a comparison in the efficiency of the estimation of the clients that are going to default, and obtaining as a result that the most balanced model at time of evaluation is the Random Forest

    Similar works