Artificial Intelligence with Reinforcement Learning on Video-Games

Abstract

Σκοπός της διπλωματικής εργασίας ήταν η υλοποίηση με λογισμικό ενός συστήματος Τεχνητής Νοημοσύνης (AI) που να μπορεί να μάθει να παίζει βίντεο-παιχνίδια. Στο πρώτο κεφάλαιο αναπτύχθηκαν περιληπτικά οι τρεις βασικοί τύποι Μηχανικής Μάθησης (ML) και επισημάνθηκε σε ποιον από αυτούς οριοθετείται το δικό μας πρόβλημα. Στο δεύτερο κεφάλαιο αναπτύχθηκε αναλυτικά η θεωρία στην οποία βασίζονται τα Νευρωνικά Δίκτυα (NN). Συγκεκριμένα αναφέρθηκαν οι νευρώνες του ανθρώπινου εγκεφάλου, οι τεχνητοί νευρώνες Perceptron και Adaline και οι τύποι των Νευρωνικών Δικτύων που μπορούν να κατασκευαστούν από μοντέρνους τεχνητούς νευρώνες. Τέλος αναπτύχθηκαν διεξοδικά τα Συνελικτικά Νευρωνικά Δίκτυα (CNN), καθώς και τα Μακρά Νευρωνικά Δίκτυα Βραχείας Μνήμης (LSTM) που χρησιμοποιήθηκαν κατά κόρον στην εργασία αυτή. Στο τρίτο κεφάλαιο αναπτύχθηκε η θεωρία της Ενισχυτικής Μάθησης. Συγκεκριμένα συζητήθηκαν οι Διαδικασίες Λήψης Αποφάσεων Markov (MDP), οι εξισώσεις Bellman, οι τύποι συστημάτων που λειτουργούν με Διαδικασίες Λήψης Αποφάσεων Markov και ο τρόπος εκπαίδευσης των συστημάτων Ενισχυτικής Μάθησης. Τέλος, παρουσιάστηκε αναλυτικά ο αλγόριθμος Ενισχυτικής Μάθησης Asynchronous Advantage Actor-Critic (A3C) της Google, που χρησιμοποιήθηκε για την κατασκευή του λογισμικού της εργασίας αυτής. Στο τέταρτο κεφάλαιο παρουσιάστηκε το παιχνίδι που χρησιμοποιήθηκε στην εκπαίδευση του λογισμικού της εργασίας. Επίσης αναλύθηκαν οι τύποι των Νευρωνικών Δικτύων που χρησιμοποιήθηκαν ως συστατικά για την υλοποίηση του δικού μας συστήματος Τεχνητής Νοημοσύνης. Στο πέμπτο και τελευταίο κεφάλαιο παρουσιάστηκαν τα πειράματα και τα αποτελέσματα της διαδικασίας εκπαίδευσης του συστήματος.The purpose of this thesis was the implementation of an Artificial Intelligence (AI) system via software so that it would learn to play video games. In the first chapter the three basic types of Machine Learning (ML) were discussed in short and the type of Machine Learning that is related to our problem was specified. In chapter two, the theory on which Neural Networks (NN) are based was reviewed in detail. In particular we referred to the neurons of the human brain, the Perceptron and Adaline artificial neurons and the types of Neural Networks that can be constructed by modern artificial neurons. Finally, Convolutional Neural Networks (CNN) were detailed, as well as the Long Short-Term Memory Neural Networks (LSTM) that were used in this thesis extensively. In chapter three, we studied the theory of Reinforcement Learning (RL). Particularly, Markov Decision Processes (MDP), Bellman equations, the type of systems which operate with Markov Decision Processes and the way of training systems of Reinforcement Learning were discussed. Finally, Google’s Asynchronous Advantage Actor-Critic (A3C) algorithm for Reinforcement Learning, used for the development of the software in this thesis, was presented in detail. In chapter four, we presented the game used for training the software of this thesis. Furthermore, the types of Neural Networks which were used as components for the implementation of our system of Artificial Intelligence were analyzed. In the fifth and final chapter, the experiments and the results of the training process of the system were presented

    Similar works