BRL Quasi-Optimal à l'aide de Transitions Locales Optimistes

Araya, Mauricio; Buffet, Olivier; Thomas, Vincent

BRL Quasi-Optimal à l'aide de Transitions Locales Optimistes

Authors: Mauricio Araya
Olivier Buffet
Vincent Thomas
Publication date: 22 May 2012
Publisher: HAL CCSD

Abstract

National audienceL'apprentissage par renforcement bayésien basé modèle (BRL) permet une formalisation saine du problème consistant à agir optimalement face à un environnement inconnu, c'est-à-dire en évitant le dilemme exploration-exploitation. Toutefois, les algorithmes s'attaquant explicitement au BRL souffrent d'une telle explosion combinatoire qu'un grand nombre de travaux repose sur des algorithmes heuristiques. Cet article introduit BOLT, un algorithme heuristique simple et (presque) déterministe pour le BRL qui est optimiste vis à vis de la fonction de transition. Nous analysons la complexité d'échantillon de BOLT et montrons que, pour certains paramètres, l'algorithme est quasi-optimal au sens bayésien avec une grande probabilité. Puis, des résultats expérimentaux mettent en valeur les principales différences entre cette méthode et des travaux antérieurs

Similar works

Full text

Open in the Core reader

Download PDF

Available Versions

INRIA a CCSD electronic archive server

oai:HAL:hal-00735602v1

Last time updated on 09/11/2016

HAL-Rennes 1

oai:HAL:hal-00735602v1

Last time updated on 31/01/2024