Contrôle de formation d'un réseau de drones à base d'apprentissage par renforcement

Abstract

International audienceNous présentons dans cet article une solution innovante basée sur un algorithme d'apprentissage par renforcement, le Q-learning, pour le contrôle de formation d'un réseau de drones par un unique opérateur. Pour suivre automatiquement le drone maître, le seul téléguidé, tous les autres n'utilisent que les puissances de signal reçues durant les communications ad hoc. Grâce à ces seules valeurs obtenues en temps-réel, nous montrons que la formation peut être parfaitement maintenue en appliquant notre schéma comportemental. La solution proposée a été implantée sous forme protocolaire et testée sous ns-3. Les expérimentations montrent l'efficacité de notre approche

    Similar works