Trabajo de fin de máster en Bioinformática y Biología ComputacionalEl Machine learning (ML) es una herramienta de uso creciente en el área de la salud y clínica. El empleo de algoritmos matemáticos enfocados a la predicción nos permite obtener conocimiento a partir de datos y realizar predicciones a partir de nuevas instancias que se le suministren al algoritmo. Tras el Alzheimer, el Parkinson es la segunda enfermedad neurodegenerativa más prevalente. Existen síntomas no motores que afectan al paciente de una manera temprana como por ejemplo el deterioro en el habla. Existen técnicas no invasivas que valoran este deterioro en la voz y cuyos datos pueden emplearse para alimentar modelos de ML. Con todo ello, se planteó el objetivo de desarrollar un modelo de ML a partir de datos de grabaciones de voz almacenados en repositorios públicos que permitan distinguir entre individuos con Parkinson y sanos. Resultados: Se obtuvo un modelo de ML empleando la técnica de Random forest con una sensibilidad de 0.891 y una especificidad de 0.873. Este modelo obtuvo un accuracy de 0.866 en la validación cruzada y de 0.907 en la validación con un conjunto de test. Conclusión: Se puede hacer uso de herramientas de ML para clasificar enfermedades complejas del tipo Parkinson empleando técnicas no invasivas