Utilisation du théorème de Buckingham pour le transfert d'apprentissage multisystèmes : une étude de cas avec trois véhicules partageant la même base de données

Abstract

Avec l’intérêt grandissant pour les algorithmes d’apprentissage, de nombreux efforts ont été déployés pour utiliser cette technologie pour des planificateurs et des contrôleurs de différents systèmes pour que ceux-ci puissent tirer des enseignements de leurs expériences et s’améliorer au fil du temps. Cependant, des difficultés majeures limitent le succès de ces modèles d’apprentissage lorsqu’il s’agit de contrôler des plateformes physiques réelles puisque cette méthode nécessite un nombre considérable de tests expérimentaux ou doit se baser sur des simulations à haute fidélité. Le projet de recherche dont traite ce mémoire explore le potentiel d’une architecture d’apprentissage qui exploite des nombres adimensionnels basés sur le théorème π de Buckingham afin d’accélérer et d’améliorer la précision de cet apprentissage et de faciliter le partage des connaissances entre des systèmes similaires pour pallier à ces différents problèmes. Ce mémoire présente une étude de cas utilisant trois véhicules de tailles réduites pour comparer les résultats de modèles d’apprentissage traditionnels avec les résultats obtenus grâce à la méthode adimensionnelle proposée. Le problème étudié est la prédiction de la position et de l’orientation relative finale d’un véhicule roulant à vitesse initiale vi après une manœuvre soudaine de changement de direction combiné au freinage sur différents types de chaussée. Cette prédiction pourrait alors être utilisée dans un pipeline de contrôle pour sélectionner la meilleure manœuvre dans une situation d’urgence. D’abord, la comparaison est faite grâce à des données recueillies à l’aide d’une simulation cinématique simplifiée. Ensuite, la méthode proposée est validée grâce à des valeurs expérimentales obtenues avec les trois plateformes robotiques étudiées. Les résultats en simulation montrent non seulement que cette nouvelle approche peut accélérer le taux d’apprentissage et améliorer la précision du modèle, mais aussi que l’apprentissage peut être transféré d’un système à l’autre plus aisément qu’avec un modèle d’apprentissage traditionnel. Les tests expérimentaux ont toutefois généré des résultats moins concluant dut à la complexité de capturer tous les phénomènes dynamiques reliés à une manœuvre d’urgence

    Similar works