El presente Trabajo Fin de Grado se encuadra en el marco general de la Inteligencia Artificial (IA), en particular en el ámbito del aprendizaje máquina. La IA pretende dotar a las máquinas de la capacidad de solucionar problemas a través del paradigma de la inteligencia humana.
En concreto, este trabajo trata de la aplicación del aprendizaje máquina a la clasificación de patrones en problemas de clasificación binaria, que consiste en distinguir entre patrones de dos clases diferentes. Los métodos de aprendizaje máquina “aprenden” a resolver el problema de clasificación a partir de un conjunto de ejemplos etiquetados (conjunto de patrones con indicación de la clase a la que pertenece cada patrón). Este conjunto de ejemplos habitualmente se denomina conjunto de entrenamiento. Dentro de la clasificación binaria, se considerarán problemas desequilibrados o desbalanceados, que son aquellos en los que el número de patrones disponibles correspondientes a cada una de las dos posibles clases es sensiblemente diferente. Estos problemas son de gran importancia, ya que hay un gran número de aplicaciones con estas peculiaridades, como por ejemplo la detección de fraude (las operaciones fraudulentas son muchas menos que las legales) o la diagnosis médica de alguna enfermedad (el número de pacientes sanos es mucho mayor que el de enfermos). Además, como sucede en estos ejemplos, en muchas ocasiones el objetivo más importante es precisamente la detección de patrones de la clase minoritaria.
La utilización de métodos de aprendizaje máquina en este tipo de problemas tiene como dificultad potencial que los ejemplos de la clase mayoritaria pueden dominar en el aprendizaje y ocultar los ejemplos de la clase minoritaria. Para evitar este posible efecto es necesario tomar medidas que equilibren la aportación en el aprendizaje de las muestras correspondientes a las dos clases.
En el trabajo, en primer lugar se ha obtenido un conjunto de bases de datos reales correspondientes a problemas de clasificación binaria y con datos desbalanceados. Las bases de datos elegidas corresponden a problemas reales que han sido tratados en la literatura utilizando otros métodos de clasificación. Para resolver estos problemas de clasificación, se han utilizado redes neuronales artificiales, en concreto, perceptrones multicapa. Se han considerado varias alternativas para tener en cuenta el desequilibrio de los datos. Por un lado, se han utilizados dos funciones de coste para el aprendizaje de la red neuronal que tienen en cuenta el diferente número de muestras de cada clase: la primera es una función de coste basada en el error cuadrático medio ponderado; la segunda es una función de coste basada en el riesgo de Bayes. Por otro lado se han utilizado combinadores de clasificadores, que ya han demostrado en la literatura que pueden ser útiles en este tipo de problemas. Los clasificadores obtenidos se han evaluado utilizando varias figuras de mérito, y se han comparado las prestaciones obtenidas con los distintos métodos considerados en cada una de las bases de datos.
Para realizar la evaluación de los clasificadores, se ha seguido la metodología habitual empleada cuando se utilizan métodos de aprendizaje máquina. Cada base de datos se divide en dos conjuntos de patrones: conjunto de entrenamiento y conjunto de test. Los parámetros del clasificador se obtienen a partir de los patrones del conjunto de entrenamiento. Una vez obtenidos estos parámetros, o lo que es lo mismo, una vez diseñado el clasificador, las prestaciones del mismo se evalúan utilizando el conjunto de test, cuyos patrones no se utilizaron en el procedimiento de aprendizaje.
Finalmente, a la vista de los resultados obtenidos con cada uno de los métodos considerados, se discute sobre las principales conclusiones extraidas a partir de dichos resultados.This Degree's Final Project is developed in the general framework of
Artificial Intelligence (AI), and particularly, within the scope of machine
learning. AI intends to equip machines with the ability to solve problems
through human intelligence paradigm. To do so, diferent computational and
statistical tools are used. These have advanced and developed new techniques
for decades. However, years ago big amounts of data weren't available. That
fact has changed thanks to Internet and present data storage capacity. Due
to this, to improve machine learning is a possibility.
Many companies already use machine learning to improve their decisions.
Some like BlackRock (Williams, 2015) use data from Google and Twitter
to take decisions on investments. World's most powerful companies, such as
Google, Apple, Facebook, Microsoft, etc. (Rodríguez, 2016) have invested for
years in investigation for the implementation of applications based on AI.
Some examples are Siri from Apple or Cortana from Microsoft, which work
as virtual assistants.
Out of the economic sphere, these techniques also help in critical aspects
such as saving lives through medical diagnosis (Kononenko, 2001), with applications such as the analysis of electrocardiogram signals.
The amount of money involved in these applications lead the decisions of
both private and public companies to invest on them.
One of the recurring problem of AI and machine learning is pattern classification (Duda et al., 2001), that allows machines to decide when facing
diferent stimuli. Within classi cation, there are numerous occasions in which
data are unbalanced, that is, the number of samples of each class might be
sensibly diferent. In addition, in these cases, the class with the least number of samples usually is the most important to be correctly detected. An
example of this kind of problems might me fraud detection, in which, a greater number of legal use samples are available compared to the ones of fraud
crimes.
About regulatory framework, this will depend fundamentally on the concrete application on which the application is used. The main aspects to take
into consideration are: data confidentiality, patents for used methods, and
software licenses.
Ultimately, AI, and therefore, classification, is an instrument of great
utility and social impact, and it is expected to be omnipresent in a not so
distant future, since its applications only have a limit in imagination.Ingeniería de Sistemas de Comunicacione