With the increase in the availability of data, especially in the educational context, specific areas have emerged for the extraction of relevant information, such as Educational Data Mining (MDE), which integrates numerous techniques that support the capture, processing and analysis of these sets of records. The main technique associated with MDE is Machine Learning, which has been used for decades in data processing in different contexts, but with the advent of Big Data there was an intensification in the application of this technique in order to extract relevant information from a huge amount of data. In this sense, this study aims to predict the performance of students, using a set of public data, and to compare which of the Machine Learning algorithms used was the most effective, in addition to indicating which are the main predictive attributes for student performance. For this, an EAW process based on 4 steps was implemented: 1) Data collection; 2) Extraction of resources and cleaning of data (Pre-Processing and Transformation); and 3) Analytical processing and algorithms; 4) analysis and / or interpretation of results. As a result, it was identified that for the data set used in this study, the Decision Trees algorithm was the most accurate - with an accuracy of 87% - as well as it was found that attributes related to school activities are more predictive of student performance than demographic and socioeconomic characteristics data.Con el aumento de la disponibilidad de datos, especialmente en el contexto educativo, han surgido áreas específicas para la extracción de información relevante, como Educational Data Mining (MDE), que integra numerosas técnicas que apoyan la captura, procesamiento y análisis de estos conjuntos. de registros. A principal técnica associada a MDE é a Aprendizagem de Máquina, que vem sendo empregada a décadas no processamento de dados em diversos contextos, mas com o advento do Big Data houve uma intensificação na aplicação dessa técnica no intuito de extrair informações relevantes de uma enorme quantidade de dados. En este sentido, este estudio tiene como objetivo predecir el rendimiento de los estudiantes, utilizando un conjunto de datos públicos, y comparar cuál de los algoritmos de aprendizaje automático utilizados fue el más efectivo, además de indicar cuáles son los principales atributos predictivos del rendimiento de los estudiantes. . Para ello, se implementó un proceso de ODE basado en 4 pasos: 1) Recolección de datos; 2) Extracción de recursos y limpieza de datos (Pre-Procesamiento y Transformación); y 3) Procesamiento analítico y algoritmos; 4) análisis y / o interpretación de resultados. Como resultado, se identificó que para el conjunto de datos utilizado en este estudio, el algoritmo de árboles de decisión fue el más preciso, con una precisión del 87%, y se encontró que los atributos relacionados con las actividades escolares son más predictivos de los estudiantes. desempeño que los datos de características demográficas y socioeconómicas.Com a o aumento da disponibilidade de dados, sobretudo no contexto educacional, surgiram áreas específicas para extração de informações relevantes, como a Mineração de Dados Educacionais (MDE), que integra inúmeras técnicas que dão suporte a captação, processamento e análises desses conjuntos de registros. A principal técnica associada a MDE é a Aprendizagem de Máquina, que vem sendo empregada a décadas no processamento de dados em diversos contextos, mas com o advento do Big Data houve uma intensificação na aplicação dessa técnica no intuito de extrair informações relevantes de uma enorme quantidade de dados. Nesse sentido, esse estudo tem como objetivo realizar a previsão do desempenho de alunos, em um conjunto de dados públicos, e comparar qual dos algoritmos de aprendizagem de máquina utilizados foi o mais eficaz, ademais indicar quais os principais atributos preditores para o desempenho dos alunos. Para isso foi implementado um processo de MDE baseado em 4 etapas: 1) Coleta de dados; 2) Extração de recursos e limpeza de dados (Pré-Processamento e Transformação); e 3) Processamento analítico e algoritmos; 4) análise e/ou interpretação dos resultados. Como resultado foi identificado que para o conjunto de dados utilizado neste estudo o algoritmo Árvores de Decisão foi o mais preciso – com uma acurácia de 87% – bem como foi constatado que atributos relacionados as atividades escolares são mais preditores para o desempenho dos alunos do que dados de características demográficas e socioeconômicas