Résumé :
|
Dans l’industrie moderne, les robots mobiles occupent une place primordiale. Ces machines sont souvent appelés à effectuer plusieurs tâches, qui nécessitent l’évolution dans son environnement. Dans certains cas, l’acquisition des connaissances est une tâche difficile à réaliser. L’objectif de ce travail porte sur la commande d’un robot mobile en utilisant la technique d’apprentissage par renforcement. C’est une technique d’apprentissage à partir de l’expérience, en ne nécessitant qu’un signal scalaire comme retour indiquant la performance de l’action appliquée. Le signal de renforcement permet au navigateur d’ajuster sa stratégie pour améliorer ses performances. Tout d’abord, l’algorithme Q-learning avec des espaces d’états et d’actions discret est appliqué, puis des planificateurs locaux à base de la logique floue sont développés pour la navigation d’un robot mobile. Pour combiner les avantages des deux techniques, une stratégie de commande avec une capacité d’apprentissage est utilisée. C’est une extension de Q-learning aux cas continus, ou le système d’inférence floue, permettant l’introduction des connaissances disponibles à priori pour que le comportement initial soit acceptable.
|