Modifiering av lärandeprocessen bakom algoritmen Expert Iteration

Sjöblom, Johan

Modifiering av lärandeprocessen bakom algoritmen Expert Iteration

Authors: Johan Sjöblom
Publication date: 1 January 2019
Publisher: KTH, Skolan för elektroteknik och datavetenskap (EECS)

Abstract

This thesis sets out to improve the performance of the Expert Iteration (EXIT) algorithm a simulation-based learning process to train an AI. EXIT and four different modifications are implemented and evaluated through a tournament of the board game Hex. The results suggest that the training pipeline of EXIT could be significantly simplified without a loss of performance.Föreliggande examensarbete ämnar förbättra algorithmen Expert Iteration (EXIT) en simulationsbaserad lärandeprocess för att träna en AI. EXIT samt fyra olika modifikationer implementeras och evalueras genom en turnering i brädspelet Hex. Resultaten antyder att EXIT:s träningsförfarande kan förenklas signifikant utan prestandaförsämring

Similar works

Full text

Available Versions

Academic Archive On-line (KTH, Sweden)

oai:DiVA.org:kth-266344

Last time updated on 02/04/2020

Digitala Vetenskapliga Arkivet - Academic Archive On-line

oai:DiVA.org:kth-266344

Last time updated on 16/03/2020

Publikationer från KTH

oai:DiVA.org:kth-266344

Last time updated on 30/03/2020