3 research outputs found

    Modelo de predição utilizando comitê de classificadores para identificação de perfis de interação no ambiente virtual de aprendizagem

    Get PDF
    Trabalho de Conclusão de Curso, apresentado para obtenção do grau de Bacharel no Curso de Ciência da Computação da Universidade do Extremo Sul Catarinense, UNESC.A procura por padrões de comportamento, hábitos e escolhas ocorre desde o início da vida humana. Atualmente, a sociedade se abastece de informações, as quais são encontradas em sua forma bruta, em dados, sendo necessário compreendê-los. A descoberta de conhecimento em base de dados, do inglês knowledge discovery in database, é um processo constituído por etapas para encontrar padrões e modelos válidos. A etapa de data mining, é responsável por explorar grandes quantidades de dados para encontrar os modelos, com o aumento da procura por padrões e perfis de estudantes em ambientes virtuais de aprendizagem, surgiu a mineração de dados educacionais, do inglês educational data mining, a qual adapta tarefas originalmente de data mining para explorar dados educacionais. A classificação é uma de suas tarefas e para obterem-se resultados precisos ao invés de utilizar apenas um único classificador pode-se utilizar a técnica de comitê de classificadores, a qual combina diversos classificadores básicos que ao final geram saídas diferentes, sendo necessário combiná-las de alguma forma. Em comitê de classificadores existem diversas técnicas que variam na forma da construção dos algoritmos e a combinação das saídas, pode-se citar o método de boosting, e o algoritmo de variação adaboost.M1, o qual tem foco em instâncias difíceis de classificar, atribuindo pesos ponderados. Outro algoritmo é o random subspace, que por sua vez utiliza um subconjunto aleatório de características dos dados para melhorar a relação entre a instância e a característica. O objetivo dessa pesquisa é aplicar educational data mining em uma base de dados do Moodle da Universidade do Extremo Sul Catarinense de modalidade a distância, a fim de definir perfis de interação dos alunos, baseando-se nas três interações de Moore, como: aluno-ambiente, aluno-professor e aluno-aluno, a ponto de predizer quais alunos tem mais chances de aprovação e reprovação por meio dos modelos obtidos pelos algoritmos de comitê de classificação adaboost.M1 e random subspace. A fim de identificar o modelo que obteve melhor desempenho, os resultados são comparados por meio de medidas de qualidade em classificação, para isso foram realizados 6 experimentos para verificar quais técnicas de pré-processamento interferem nos resultados das medidas utilizadas, tais como acurácia, coeficiente Kappa, TP-Rate e F-Measure. Pode-se observar que melhores resultados foram encontrados ao utilizar técnica de balanceamento de classes, podendo destacar os algoritmos adaboost.M1 e random subspace utilizando o classificador random forest como base, que chegaram a percentuais de acurácia como 93,51% e 93,77%, respectivamente. O modelo final encontrado, após analises, foi do algoritmo random subspace utilizando random forest, que alcançou em TP-Rate, 0,975 para classe “A” e 0,904 para “R”, mostrando resultados adequados para o objetivo proposto
    corecore