| Titre : | Implantation du mécanisme d'apprentissage XCS étude de cas probléme proie_prédateurs |
| Auteurs : | Imane Saoudi, Auteur ; Fatima Zohra Torki, Directeur de thèse |
| Type de document : | Monographie imprimée |
| Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2015 |
| ISBN/ISSN/EAN : | MINF/72 |
| Format : | 95 |
| Langues: | Français |
| Langues originales: | Français |
| Résumé : |
Depuis la naissance touts les êtres vivantes se développent sur tous les niveaux, et le niveau le plus important dans ce cycle de développement est le comportement, la procédure qui réalise ce développement à ce niveau est l’apprentissage. Dans le domaine d’informatique l’apprentissage a devenu un axe principal dans des plusieurs domaines d’informatiques tel que la robotique et les jeux de vidéos...Etc. Dans ce mémoire, on a essayé de simuler le comportement d'un groupe de prédateurs ont été conçus avec seulement une vue locale où ils peuvent sentir leur environnement. Si la proie est trouvée, ses coordonnées seront diffusées à tous d'autres prédateurs puis pour capturer la proie tous les prédateurs doivent collaborer et prendre en considération les positions des autres prédateurs pour atteindre l'objectif global qui consiste à cercler et capturer la proie. Pour faire la simulation, nous avons suivi une approche de l'apprentissage qui est le système de classifieurs. Il combine des mécanismes d’algorithmes génétiques et des techniques d’apprentissage par renforcement pour apprendre des actions appropriées pour toute entrée qu'ils reçoivent. Comme il a été mentionné dans le premier chapitre, il existe plusieurs variantes de systèmes de classeurs, nous choisissons l'une qui est l'XCS à base de précision puisque il est le plus utilisé parmi les autres variantes des systèmes d’apprentissage. Durant la réalisation de notre système, on a pu faire: Une étude raffinée et détaillée du système de classeurs de type XCS. On a étudié le problème de prédateur-proie avec un éclairage sur la façon dont les agents avec des informations locales pourraient apprendre en collaboration dans un environnement multi-agent. Implémenter un système d'apprentissage à base de l'XCS qui simule le comportement du prédateur (agent cognitif). Implémenter le comportement de proie (agents réactifs). Construire un module d'affichage à base d'OpenGL qui permet d'afficher la simulation comportementale des prédateurs avec la proie. Durant la programmation de notre système, on a suivi l'approche orienté objet où chaque module est une boite noire qui peut réutiliser par d'autres systèmes. Par exemple, l'XCS n'est pas spécifique au problème de prédateur-proie mais il peut être réutilisé pour traiter d'autres problèmes. Pour permettre la manipulation des différents paramètres de l'XCS tel que le taux d'apprentissage, la qualité initiale, on les rassembler dans un fichier à part. Notre système offre la possibilité d'afficher la perception, l’action réalisée, la récompense actuelle et l'état actuel de la base de règles des prédateurs. Tout travail a des perspectives à ajouter, comme il est le cas de notre système. Pour cela, on peut envisager les perspectives suivantes: Améliorer le système de classifieurs XCS pour répondre d’une manière plus efficace avec le cas d’une proie dynamique et pour quoi pas avec une proie agissant intelligemment. Etudier les deux comportements coopératif et compétitif en même temps. Améliorer la qualité graphique de la scène puisque notre objectif c'est la simulation comportementale et non la simulation graphique |
| Sommaire : |
Introduction générale 1 Chapitre(1) : Etude théorique des concepts de base adoptés 3 Introduction 3 Description de problème 3 Historique et travaux relatifs 4 Le système de Malrey Lee en 2003 4 Le travail de M. Benda, V. Jagannathan, et R. Dodhiawala en 2010 6 Mécanismes de base du système de classifieurs 7 Les algorithmes génétiques 8 Structure d’un algorithme génétique....................................................................8 Opérations sur les algorithmes génétiques...........................................................9 Apprentissage par renforcement(AR) 14 Présentation........................................................................................................14 L’origine de l'apprentissage par renforcement...................................................15 Les Processus de Décision Markovien (PDM)..................................................16 Programmation dynamique (PD).......................................................................18 L’algorithme Q-LEARNING............................................................................20 Les systèmes de classifieurs (LCS) 20 Présentation des éléments de base 21 Codage des messages et liste de classifieurs 22 La liste de messages 23 Fonctionnement 23 Renforcement 24 La découverte de nouveaux classifieurs 26 Les environnements de travail des LCS 27 Différentes versions de systèmes de classifieurs 27 ZCS (Zeroth-level Classifier System) 28 ACS (Anticipatory Classifier System) 29 XCS (eXtended Classifier System) 32 Le classifieur 33 Macroclassifiers 34 Fonctionnement 34 Evaluation des classifieurs 36 Découverte des classifieurs 37 Effacement des classifieurs 38 L’opérateur de "subsumption" 39 Paramètres 40 Applications utilisant les Systèmes de Classifieurs 41 Simulation 41 Robotique 44 Classification 45 Conclusion 46 Chapitre(2) : Conception du système 47 Introduction 47 Conception globale 48 Vue globaleConception détaillée 48 Le fonctionnement global du système 48 Conception détaillée 49 Environnement 49 proies 52 prédateur 53 Perception...............................................................................................................54 L’action..................................................................................................................56 Moteur d'apprentissage ..57 Initialisation.......................................................................................................57 Fonctionnement.................................................................................................57 Le système de rétribution..................................................................................59 Base de règles commune....................................................................................61 Visualisation ...........62 Conclusion 62 Chapitre(3) : Implémentation du système 63 Introduction 63 Environnement de l'implimentation 63 Style de manipulation de système 64 Les détails d'implémentation des différents modules 64 Environnement 64 proie 66 prédateur 68 Perception 71 L’action 73 Moteur d'apprentissage 74 Initialisation.......................................................................................................74 Classe CS...........................................................................................................75 Classe ListClassifieur ........................................................................................80 Classe Classifier.................................................................................................82 Présentation de logiciel 84 L’interface graphique 84 Initialisation 85 Résultats 86 L’étape 0 86 L’étape 1 87 L’étape 2 88 Evaluation du système 89 Conclusion 90 Conclusion générale 91 Bibliographie 93 |
| Type de document : | Mémoire master |
Disponibilité (1)
| Cote | Support | Localisation | Statut |
|---|---|---|---|
| MINF/72 | Mémoire | bibliothèque sciences exactes | Consultable |



