thesis

Random Forests para detección de fraude en medios de pago

Abstract

Los conjuntos de clasificadores constituyen una de las técnicas más eficaces y sencillas para resolver problemas de clasificación. Se basan en la construcción de una serie de clasificadores cuya combinación, bajo unas ciertas condiciones, mejora el resultado obtenido por cada uno de ellos individualmente. Este trabajo se centra en el estudio de por qué y cuáles son las condiciones necesarias para que este tipo de técnicas resulten ser tan eficaces. El resultado del estudio teórico hace que el algoritmo random forest sea elegido como el más adecuado para ser aplicado al problema de clasificación de fraude, el cual se caracteriza por el significativo desbalanceo entre sus clases y el gran volumen de datos manejado. Para ello, se ha desarrollado una librería en C, con la que han sido llevados a cabo experimentos sobre transacciones bancarias reales con dos objetivos principales: por un lado, comparar el rendimiento obtenido por random forest con otros algoritmos tanto lineales como no lineales y por otro, analizar el impacto del valor de sus parámetros sobre el rendimiento final del conjunto

    Similar works