Titre : | Comportement adaptatif d'agents dans des environnements virtuels |
Auteurs : | Fatima Zohra Torki, Auteur ; Foudil Cherif, Directeur de thèse |
Type de document : | Thése doctorat |
Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2011 |
ISBN/ISSN/EAN : | TINF/35 |
Format : | 1 vol. (136 p.) / ill. / 29 cm |
Langues: | Français |
Résumé : |
Un environnement virtuel est peuplé d‟agents en interaction. La création de ces environnements repose sur un principe d‟autonomie des entités. Ça implique que la simulation de comportements des entités virtuelles devient un problème très complexe lorsque ces entités sont plongées dans ces environnements virtuels dynamiques et confrontées à des situations imprévues. Les agents réactifs agissent en temps réel mais ils s‟adaptent difficilement à des environnements dynamiques.Notre étude sera concentrée sur les approches issues de la vie artificielle offrant des caractéristiques d‟adaptation, d‟évolution et d‟apprentissage. Nous créons une architecture combinant différents mécanismes afin d‟augmenter les capacités de raisonnement des entités virtuelles. Cette architecture se compose de deux modèles, le premier permet de coupler fortement la perception et l‟action pour fournir une réponse plus rapide à l‟environnement, et il est basé sur l‟approche de motor schemas qui a déjà montré son efficacité à résoudre des problèmes de navigation d‟entités autonomes. Cependant, cette solution est très coûteuse. Le programmeur doit en effet définir les paramètres des schémas de façon manuelle. Pour pallier ce problème, nous définissons un modèle supplémentaire permettant aux entités autonomes d‟obtenir des comportements adaptatifs basant sur un système d‟apprentissage. Notre approche se base sur les systèmes de classeurs dont le rôle est d‟apprendre et d‟évaluer des actions correspondant aux paramètres mentionnés. |
Sommaire : |
Introduction Générale………………………………………………………………………………1 Agents autonomes et simulation comportementale………………………………..4 1 La simulation comportementale………………………………………………………………………………….5 2 Définitions usuelles……………………………………………………………………………………………………..5 2.1 Les agents autonomes………………………………………………………………………………………….5 2.2.1 Proprietés d’agents……………………………………………………………………………………….7 2.2 Les approches orientée comportements………………………………………………………………7 3 Les types d’agents et les architectures comportementales……………………………………….11 3.1 Les agents délibératifs………………………………………………………………………………………..11 3.2 Les agents réactifs………………………………………………………………………………………………12 3.2.1 Historique des champs de potentiel…………………………………………………………….12 3.2.2 Approche de subsomption de R.Brooks……………………………………………………….13 3.2.3 Boids…………………….……………………………………………………………………………………..16 3.2.4 L’architecture ascendante de P. Maes…………………………………………………………17 3.3 Les agents évolutionnistes………………………………………………………………………………….19 3.4 Les agents hybrides…………………………………………………………………………………………….22 4 Notions d’intéractions……………………………………………………………………………………………….23 4.1 Intéractions environnement –agents………………………………………………………………….24 4.2 Intéractions agent –agent…………………………………………………………………………………..25 5 Adaptation de l’agent à son environnement……………………………………………………………..26 5.1 L’environnement……………………………………………………………………………………………………26 5.1.1 Environnements dynamiques………………………………………………………………………….27 5.1.2 Environnements Markoviens…………………………………………………………………………..27 5.2 Mécanismes d’adaptation……………………………………………………………………………………28 5.2.1 L’´evolution……………………………………………………………………………………………………..28 5.2.2 L’apprentissage……………………………………………………………………………………………….29 6 Conclusion…………………………………………………………………………………………………………………30 Systèmes évolutionnaires……………………………………………………………….…….32 1 Introduction………..…………………………….…….....…….………………………………………...….……....32 2 Les algorithmes génétiques………..…………………………….………....………………….…..…….…...33 2.1 Structure d'un algorithme génétique..….………………….……….………….........………..33 2.2 Génome des individus...………………………..………………….……….………….......…………..34 2.3 Création de la population initiale...…………………………………..……………………....…….35 2.4 Evaluation……...………………………………………………………………..……..………..………….…35 2.5 Sélection………………………………………………………………….……..………….……….…………..35 2.5.1 La roulette pipée ………………………………………............……..…………………………36 2.5.2 Le reste stochastique ……………………………………………….…………………………...36 2.5.3 La sélection par tournoi……………………………………..…………….….………………….37 2.5.4 La sélection par rang… …………………………………….……………..….…….……….….…37 2.6 Reproduction……………………………………………………………………….…….……………….…...37 2.6.1 Croisement……………..… …………………………………….……………..….…….………….…38 2.6.1.1 Croisement à un point de coupe………………..……...……..……………..…...38 2.6.1.2 Croisement à deux points de coupe……….…………….…….…….……….…..39 2.6.1.3 Croisement uniforme…………………………….……..…………………….…….……39 2.6.2 Mutation…………………………………………………………………………….…………………...40 2.7 Le critère d'arrêt………………………………………………………………………..……………...…..40 3 systèmes de classeurs…………………………………………………………………………………………..….41 3.1 Learning Classifier Systems (LCS)……………………………………………………………………………41 3.1.1 Codage des informations et base de règles……………………………………………….42 3.1.2 Fonctionnement des LCS…………………………………………………………………………..44 3.1.3 Les environnements de travail des LCS…………………………………………………….47 3.1.3.1 Multiplexeur booléen ............................................................................. 48 3.1.3.2 Environnement Woods ........................................................................... 49 3.2 Versions évoluées des systèmes de classeurs……………………………………………………….51 3.2.1 Zeroth Level Classifier Systems (ZCS)…………………………………………………………51 3.2.1.1 Fonctionnement des ZCS ....................................................................... 52 3.2.1.2 Renforcement ........................................................................................ 53 3.2.1.3 Mécanisme de découverte ..................................................................... 55 3.2.1.4 ZCS étendus…………………………………………………………………………………….56 3.2.2 eXtended Classifier System de Wilson (XCS) 58 3.2.2.1 Fonctionnement des XCS ........................................................................ 59 3.2.2.2 Structure des classeurs ........................................................................... 60 3.2.2.3 Résolution de conflit .............................................................................. 61 3.2.2.4 Renforcement ...................................................................................... 62 3.2.2.5 La découverte des nouveaux classeurs ................................................ 64 3.2.2.6 Architecture de subsomption .............................................................. 66 3.2.2.7 XCS étendus ......................................................................................... 67 3.2.3 ACS : Anticipatory Classifier System…………………………………………………………69 3.2.3.1. Principe ................................................................................................ 69 3.2.3.2. Architecture ......................................................................................... 70 3.2.3.3. Optimisation par séquence de comportements .................................. 72 3.2.4 YCS de Bull……………………………………………………………………………………………….73 3.2.5 Tableau de synthèse des principaux systèmes de classeurs ………………..….76 4 Conclusion………………………………………………………………………………………………………………..77 Simulation comportementale par systèmes de classeurs…………………..……78 1 Systèmes comportementaux de référence………..……………………………………..……..….………79 1.1 Approche basée théorie des motor schemas de R. Arkin……………….………………….79 1.2 les systemes comportementaux évolutionaires…………………………………………………81 2 Architecture globale du système ………………………………………………………………………….…..84 2.1 L’environnement ....................................................................................................86 2.1.1 Librairies graphiques........................................................................................88 2.2 Le module de perception (capteurs) …………………………………………………………….…..88 2.3 Le module action ……………………………………………………………………………….…………...89 2.4 Le module comportemental (système décisionnelle) ………………………………….…….90 2.4.1 L’intégration de l’apprentissage .................................................................. ....92 2.4.1.1 Méthodologie d'apprentissage ................................................................. 94 2.4.1.2 Représentation d’une règle ...................................................................... 95 2.4.1.3 Initialisation de la base de règles .............................................................. 97 2.4.1.4 Sélection d’un classifieur .......................................................................... 98 2.4.1.5 Système de rétribution ............................................................................. 99 2.4.1.6 Phases d’apprentissage et d’évolution ................................................... 100 2.4.1.7 L’algorithme génétique ........................................................................... 100 3.4.1.8 Fréquence d’appel à l’algorithme génétique ..................................... 102 3.4.1.9 Le covering ............................................................................................. 103 3 Récapitulatif ................................................................................................................. 103 4 Conclusion .................................................................................................................... 104 Implémentation et résultats .................................................................. 105 1 Langage de programmation ........................................................................................... 105 2 L’architecture globale d’une implémentation ................................................................ 106 3 Les algorithmes utilisés ................................................................................................... 108 3.1 dynamique d’un système de classeurs .............................................................. 109 3.2 Fonction d’animation d’agents ......................................................................... 110 4 Mise en oeuvre de la simulation ................................................................................. 111 4.1 L’environnement virtuel ...................................................................................... 112 4.2 Les agents virtuels ................................................................................................ 112 4.2.1 L’agent programmé ....................................................................................... 113 4.2.2 L’agent apprenti ............................................................................................. 113 4.2.2.1 interface d’entrée -sortie ............................................................................ 113 5 Les conditions initiales de l’application ....................................................................... 115 6Les résultats obtenus ....................................................................................................... 115 6.1 Analyses des résultats ....................................................................................... 116 7 La discussion des résultats ........................................................................................... 118 8 Bilan ……………………… .................................................................................................... 121 9Conclusion…………….. ........................................................................................................ 122 Conclusion et Perspectives…. ...................................................................................... 123 Bibliographie .............................................................................................................. 126 |
En ligne : | http://thesis.univ-biskra.dz/id/eprint/847 |
Disponibilité (1)
Cote | Support | Localisation | Statut |
---|---|---|---|
TINF/35 | Mémoire de magister | bibliothèque sciences exactes | Consultable |