Modifiering av lärandeprocessen bakom algoritmen Expert Iteration

Abstract

This thesis sets out to improve the performance of the Expert Iteration (EXIT) algorithm a simulation-based learning process to train an AI. EXIT and four different modifications are implemented and evaluated through a tournament of the board game Hex. The results suggest that the training pipeline of EXIT could be significantly simplified without a loss of performance.Föreliggande examensarbete ämnar förbättra algorithmen Expert Iteration (EXIT) en simulationsbaserad lärandeprocess för att träna en AI. EXIT samt fyra olika modifikationer implementeras och evalueras genom en turnering i brädspelet Hex. Resultaten antyder att EXIT:s träningsförfarande kan förenklas signifikant utan prestandaförsämring

    Similar works