Este trabalho aplica o processo de descoberta de conhecimento em base de dados (KDD) no conjunto de dados abertos do ENEM por escola no ano de 2015, com o objetivo de encontrar relações entre os indicadores contextuais presentes na base de dados e as notas médias nas diferentes áreas de conhecimento avaliadas pelo exame. No pré-processamento os dados são adequados e filtrados, com o Microsoft Excel e o software R, para serem utilizados na etapa seguinte. Na fase de mineração de dados utiliza-se o software R para a aplicação de algoritmos de classificação e de regressão linear.Os resultados obtidos através das técnicas de mineração de dados são transformados em conhecimento útil e apresentado através de gráficos. A regressão linear indica uma grande eficiência na previsão da nota de língua portuguesa, mostrando forte influência dos indicadores contextuais para sua determinação