Clasificadores neuronales para problemas binarios desequilibrados

Pérez Íñigo, Eva

Clasificadores neuronales para problemas binarios desequilibrados

Authors: Eva Pérez Íñigo
Publication date: 1 January 2017
Publisher

Abstract

El presente Trabajo Fin de Grado se encuadra en el marco general de la Inteligencia Artiﬁcial (IA), en particular en el ámbito del aprendizaje máquina. La IA pretende dotar a las máquinas de la capacidad de solucionar problemas a través del paradigma de la inteligencia humana. En concreto, este trabajo trata de la aplicación del aprendizaje máquina a la clasiﬁcación de patrones en problemas de clasiﬁcación binaria, que consiste en distinguir entre patrones de dos clases diferentes. Los métodos de aprendizaje máquina “aprenden” a resolver el problema de clasiﬁcación a partir de un conjunto de ejemplos etiquetados (conjunto de patrones con indicación de la clase a la que pertenece cada patrón). Este conjunto de ejemplos habitualmente se denomina conjunto de entrenamiento. Dentro de la clasiﬁcación binaria, se considerarán problemas desequilibrados o desbalanceados, que son aquellos en los que el número de patrones disponibles correspondientes a cada una de las dos posibles clases es sensiblemente diferente. Estos problemas son de gran importancia, ya que hay un gran número de aplicaciones con estas peculiaridades, como por ejemplo la detección de fraude (las operaciones fraudulentas son muchas menos que las legales) o la diagnosis médica de alguna enfermedad (el número de pacientes sanos es mucho mayor que el de enfermos). Además, como sucede en estos ejemplos, en muchas ocasiones el objetivo más importante es precisamente la detección de patrones de la clase minoritaria. La utilización de métodos de aprendizaje máquina en este tipo de problemas tiene como diﬁcultad potencial que los ejemplos de la clase mayoritaria pueden dominar en el aprendizaje y ocultar los ejemplos de la clase minoritaria. Para evitar este posible efecto es necesario tomar medidas que equilibren la aportación en el aprendizaje de las muestras correspondientes a las dos clases. En el trabajo, en primer lugar se ha obtenido un conjunto de bases de datos reales correspondientes a problemas de clasiﬁcación binaria y con datos desbalanceados. Las bases de datos elegidas corresponden a problemas reales que han sido tratados en la literatura utilizando otros métodos de clasiﬁcación. Para resolver estos problemas de clasiﬁcación, se han utilizado redes neuronales artiﬁciales, en concreto, perceptrones multicapa. Se han considerado varias alternativas para tener en cuenta el desequilibrio de los datos. Por un lado, se han utilizados dos funciones de coste para el aprendizaje de la red neuronal que tienen en cuenta el diferente número de muestras de cada clase: la primera es una función de coste basada en el error cuadrático medio ponderado; la segunda es una función de coste basada en el riesgo de Bayes. Por otro lado se han utilizado combinadores de clasiﬁcadores, que ya han demostrado en la literatura que pueden ser útiles en este tipo de problemas. Los clasiﬁcadores obtenidos se han evaluado utilizando varias ﬁguras de mérito, y se han comparado las prestaciones obtenidas con los distintos métodos considerados en cada una de las bases de datos. Para realizar la evaluación de los clasiﬁcadores, se ha seguido la metodología habitual empleada cuando se utilizan métodos de aprendizaje máquina. Cada base de datos se divide en dos conjuntos de patrones: conjunto de entrenamiento y conjunto de test. Los parámetros del clasiﬁcador se obtienen a partir de los patrones del conjunto de entrenamiento. Una vez obtenidos estos parámetros, o lo que es lo mismo, una vez diseñado el clasiﬁcador, las prestaciones del mismo se evalúan utilizando el conjunto de test, cuyos patrones no se utilizaron en el procedimiento de aprendizaje. Finalmente, a la vista de los resultados obtenidos con cada uno de los métodos considerados, se discute sobre las principales conclusiones extraidas a partir de dichos resultados.This Degree's Final Project is developed in the general framework of Artificial Intelligence (AI), and particularly, within the scope of machine learning. AI intends to equip machines with the ability to solve problems through human intelligence paradigm. To do so, diferent computational and statistical tools are used. These have advanced and developed new techniques for decades. However, years ago big amounts of data weren't available. That fact has changed thanks to Internet and present data storage capacity. Due to this, to improve machine learning is a possibility. Many companies already use machine learning to improve their decisions. Some like BlackRock (Williams, 2015) use data from Google and Twitter to take decisions on investments. World's most powerful companies, such as Google, Apple, Facebook, Microsoft, etc. (Rodríguez, 2016) have invested for years in investigation for the implementation of applications based on AI. Some examples are Siri from Apple or Cortana from Microsoft, which work as virtual assistants. Out of the economic sphere, these techniques also help in critical aspects such as saving lives through medical diagnosis (Kononenko, 2001), with applications such as the analysis of electrocardiogram signals. The amount of money involved in these applications lead the decisions of both private and public companies to invest on them. One of the recurring problem of AI and machine learning is pattern classification (Duda et al., 2001), that allows machines to decide when facing diferent stimuli. Within classi cation, there are numerous occasions in which data are unbalanced, that is, the number of samples of each class might be sensibly diferent. In addition, in these cases, the class with the least number of samples usually is the most important to be correctly detected. An example of this kind of problems might me fraud detection, in which, a greater number of legal use samples are available compared to the ones of fraud crimes. About regulatory framework, this will depend fundamentally on the concrete application on which the application is used. The main aspects to take into consideration are: data confidentiality, patents for used methods, and software licenses. Ultimately, AI, and therefore, classification, is an instrument of great utility and social impact, and it is expected to be omnipresent in a not so distant future, since its applications only have a limit in imagination.Ingeniería de Sistemas de Comunicacione

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

Name not available

oai:e-archivo.uc3m.es:10016/27...

Last time updated on 06/05/2019

Universidad Carlos III de Madrid e-Archivo

oai:e-archivo.uc3m.es:10016/27...

Last time updated on 29/03/2020