Reinforcement Learning for Robot Control

Abstract

Cílem této práce je najít vhodný způsob, jak navrhnout a otestovat metody Reinforcement Learningu pro oblast robotiky. Tento způsob poté vhodně popsat tak, aby na jeho základu mohl čtenář samostatně navrhnout vlastní úlohy v oblasti posíleného učení pro robotiku, a to komplexně, od návrhu úlohy, modelu až po samotnou implementaci a testování. Díky tomu by práce měla najít praktické využití i v akademické sféře, například pro výuku. Součástí je rozsáhlý teoretický podklad, který čtenáře uvede do kontextu tématu Reinforcement Learningu v širších souvislostech, a to jak z pohledu umělé inteligence, a tak z pohledu neurovědy a psychologie. Zde jsou také nastíněny a objasněny aktuálně používané i historické metody posíleného učení. Je uveden přehled existujících řešení a následně výběr a podrobný popis toho nejvhodnějšího. Předává tak čtenáři výtah informací, jak s prostředím pracovat a jak provádět vlastní experimenty. Za tímto účelem práce obsahuje jeden demonstrativní experiment. Předpokladem řešení je dispozice výkonnými výpočetními prostředky, zejména z pohledu grafického výkonu.The goal of this paper is to find a suitable way to design and test Reinforcement Learning methods for the robotics domain. This method will then be suitably described so that, based on it, the reader can independently design his/her own Reinforcement Learning tasks for robotics, in a comprehensive way, from the task design and model to the actual implementation and testing. As a result, the work should also find practical applications in academia, for example for teaching. Included is an extensive theoretical background that introduces the reader to the topic of Reinforcement Learning in a broader context, both from the perspective of artificial intelligence and from the perspective of neuroscience and psychology. Here, currently used and historical methods of Reinforcement Learning are also outlined and explained. A survey of existing solutions is presented, followed by a selection and detailed description of the most suitable one. Thus, it presents the reader with an extract of information on how to work with the environment and how to conduct their own experiments. To this end, the thesis includes one demonstrative experiment. A prerequisite for the solution is the disposition of powerful computing resources, especially in terms of graphical performance.460 - Katedra informatikydobř

    Similar works