Estudio, desarrollo y evaluación de técnicas de aprendizaje automático en tareas de clasificación y/o predicción: detección de exoplanetas

Abstract

[ES] El trabajo consiste en la detección de exoplanetas a partir de observaciones de la evolución de la luminosidad de las estrellas obtenidas mediante el telescopio Kepler. La base de datos, importada desde Kaggle, contiene datos para un conjunto amplio de estrellas de las que se sabe si tienen o no un planeta orbitando a su alrededor. Para ello, se ha separado el conjunto de datos total en un conjunto de training y otro de test y se han aplicado técnicas de Machine Learning para llevar a cabo la clasificación: regresión logística, support vector machines, árboles de decisión, random forests, modelos k-NN y modelos de combinación. Además, debido al desequilibrio entre instancias positivas (estrellas con exoplaneta) y negativas (estrellas sin exoplaneta) del conjunto de datos, se han implementado dos técnicas de compensación: el submuestreo aleatorio y el sobremuestreo SMOTE. El trabajo incluye tanto el fundamento teórico de los métodos de clasificación utilizados como su aplicación sobre el conjunto de datos

    Similar works