1 research outputs found

    The learning problem, classification case

    Get PDF
    “Machine learning” o aprendizaje automático se refiere a un conjunto de algoritmos destinados a hacer las predicciones más precisas posibles de una variable de salida basada en los valores de algunas variables de entrada. Cuando la variable de salida es categórica, el proceso de generación de una predicción se llama clasificación. Problemas de este tipo ocurren muy a menudo en la práctica (por ejemplo: predecir el género de una persona, si un cliente de un banco va a incumplir su hipoteca, o si el precio de una acción en particular va a subir o bajar). Un problema importante en la clasificación es el reconocimiento de imágenes. Por ejemplo, hay reconocimiento facial en las redes sociales, apoyo diagnóstico en imágenes médicas o descubrimiento de productos (encontrar un producto similar usando una imagen de referencia). Presentamos y resolvimos el problema de aprendizaje en clasificación desde una perspectiva teórica y práctica. Primero, explicamos lo que entendemos por “aprender” para un algoritmo. Introducimos la notación matemática de las difer entes partes del problema de aprendizaje en clasificación, y demostramos matemáticamente que el aprendizaje es factible bajo nuestra definición de “capacidad de aprendizaje”. A continuación, nos concentramos en un método de aprendizaje llamado red neuronal artificial. Este método es una forma muy flexible de modelar fenómenos altamente no lineales. Introdujimos la notación matemática, y demostramos las diferentes ecuaciones que rigen su funcionamiento (el algoritmo de backpropagation en particular). Luego, mostramos cómo podemos implementar el método de red neuronal en el paquete de software R. Por último, presentamos las actuaciones del programa en un famoso conjunto de datos de prueba, a saber, la base de datos MNIST, y comparamos nuestros resultados con los mencionados en el sitio web de Lecun, que estudió ampliamente esta base de datos.Machine learning refers to a set of algorithms aimed at making the most accurate possible pre dictions of an output variable based on the values of some input variables. When the output variable is categorical, the task of generating a prediction is called classification. Classification problems occur very frequently in practice (e.g.: predicting the gender of a person, if a client of a bank is going to default on his mortgage, or if a particular share price is going to go up or down). A major problem in classification is image recognition. There is for example face recognition on social networks, diagnostic support in medical imaging, or product discoverability (finding a similar product using a reference image). We presented and solved the classification learning problem from a theorical and practical perspective. First, we explained what we mean by “learning” for an algorithm. We introduced the mathematical notation of the different parts of the classification learning problem, and we mathematically demonstrated that learning is fea sible under our definition of “learnability”. Next, concentrated on one method of learning named artificial neural network. This method is a very flexible way of modeling highly nonlinear phe nomena. We introduced the mathematical notation, and we demonstrated the different equations that govern its functioning (the backpropagation algorithm in particular). Then, we showed how we can implement the neural network method in the R software package. Finally, we presented the performances of the program on a famous testing data set, namely the MNIST database, and compared our results with those mentioned on the web site of Yann Lecun, who studied this database extensively.Magíster en MatemáticasMaestrí
    corecore