Titre : | Reconnaissance de l'écriture manuscrite arabe en utilisant l'apprentissage automatique |
Auteurs : | Mohamed Cherif Sidhoum, Auteur ; Ahmed Tibermacine, Directeur de thèse |
Type de document : | Rapport |
Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2020 |
Format : | 1 vol. (88 p.) / ill. / 29 cm |
Langues: | Français |
Résumé : | L'analyse et la reconnaissance automatiques des caractères manuscrits arabes à partir d'images est un problème important dans de nombreuses applications. Même avec les grands progrès de la recherche récente en matière de reconnaissance optique de caractères, quelques problèmes attendent encore d'être résolus, en particulier pour les caractères arabes. L'émergence des réseaux neuronaux profonds promet une solution solide à certains de ces problèmes. Nous présentons dans notre travail un réseau neuronal profond pour le problème de la reconnaissance des caractères arabes manuscrits qui utilise des modèles de réseaux neuronaux convolutifs (CNN) avec des paramètres de régularisation tels que la normalisation par lots pour éviter le sur ajustement. Nous avons appliqué le CNN profond pour les bases de données AHDD, IESK et AHCD et les précisions de classification pour les trois ensembles de données étaient de 96%, 78% et 94%, respectivement. Un deuxième modèle basé sur le Capsule Neural Network (CapsNet) a également été proposé, dont le but est d'améliorer la précision du système de reconnaissance. Les résultats montrent que notre modèle basé sur CapsNet améliore la précision du système proposé et surpasse le premier modèle, basé sur CNN. |
Sommaire : |
Chapitre 01 : Apprentissage Machines
1. Apprentissage Machine 2 2. Différents types d’apprentissage 3 2.1. Apprentissage supervisé 3 2.2. Apprentissage non supervisé 4 2.3. Apprentissage semi-supervisé 5 2.4. Apprentissage par renforcement 7 3. Généralisation 7 3.1. Sur-apprentissage 9 3.2. Régularisation 8 3.3. Malédiction de la dimensionnalité 10 4. Différents types de modèles 11 4.1. Modèles paramétriques 11 4.2. Modèles non paramétriques 12 5. Algorithmes d’apprentissage 12 5.1. Réseaux de neurones 12 5.2. Machines de Boltzmann restreintes 15 5.3. Architectures profondes 16 5.4. K-plus proches voisins 16 5.5. Fenêtres de Parzen 17 5.6. Mélanges de Gaussiennes 18 5.7. Méthodes à noyau 19 5.8. Arbres de décision 20 5.9. Méthodes Bayésiennes 21 6.Conclusion Chapitre 02 : Reconnaissance des formes 1. La reconnaissance des formes 24 1.1 Définition 24 1.2 Historique 24 2. Méthode de reconnaissance de formes 25 3. La reconnaissance de plusieurs objets dans une image 26 4. Applications typiques de la reconnaissance des formes 26 5. Schéma générale d’un système de reconnaissance des formes 27 5.1 Préparation des données 28 a. Numérisation. 28 b. Prétraitement. 28 c. Calcul des représentations 28 5.2 Apprentissage 28 5.3 Classification 28 5.4 Post traitement 28 6. Traitement d’image 29 6.1 Prétraitement ou traitement bas niveau 30 6.1.1 Définition d’image 30 6.1.2 Définition pixel 34 6.1.3 Image en niveau de gris 35 a. Filtre gaussien 35 b. Du continu au discret 35 7. Segmentation des images 34 7.1 Les principes de la segmentation 34 8. Reconnaissance de l'écriture manuscrite 36 Chapitre 03 : Conception et implémentation 1.Introduction 40 2 Conception générale de notre système 41 3 Conception d´etaill´e 42 3.1 Extraction de text 42 3.1.1 Pr´etraitement d’image. 43 3.1.1.2 Calculer l’image des gradients verticaux 44 3.1.1.3 Binariser l’image des gradients 44 3.1.1.4 Localiser les r´egions `a l’int´erieur de boˆıtes englobantes. 45 3.2 Segmentation 46 3.2.1 p r o b l è me de segmentation de s scripts arabes 46 3.2.1.1 Les techniques et m´méthodologies. 48 3.3 Reconnaissance de caract`eres 52 3.3.1 Syst`eme de reconnaissance `a base de r´eseau neuronal convolutif 52 3.3.2 Architecture d’un CNN. 52 3.3.3 Couche Convolutions (Conv) 53 3.3.4 Couche de mise en commun (Pooling). 54 3.3.5 La couche de correction ReLU. 55 3.3.6 La couche enti´erement connect´ees (fully connected). 55 3.3.7 Pourquoi CNN ? . 56 3.3.8 Base de donn´ee utilis´e . 57 3.3.9 Pr´e-traitement de la Base de donn´ee utilis´e. 58 3.3.10 architecture de notre mod`ele CNN. 60 4. Langage et librairies utilis´es dans l’impl´ementation 64 4.1 Paquets requis et biblioth`eques 64 5. Résultats obtenu pour le mod`ele de CNN 68 5.1 Utilisation du mod`ele apr´es la phase d’apprentissage 71 5.1.1 Les limites de r´eseau de neuronal convolutif 72 6. syst`eme de reconnaissance a` base de r´eseau de capsule 72 6.1 C’est quoi une capsule ? 73 6.1.1 Comment fonctionne une capsule ? 74 6.2 Les ´etapes de calcules 75 6.2.1 Multiplication matricielle des vecteurs d’entr´ee 75 6.2.2 Pond´eration scalaire des vecteurs d’entr´ee 76 6.2.3 Somme des vecteurs d’entr´ee pond´er´es 77 6.2.4 fonction d’activation non-lin´earit´e de vecteur a` vecteur 77 6.2.5 Routage dynamique entre les capsules 77 6.2.1.1 L’architecture des r´eseaux de capsules 79 III.7 Résultat . 83 III.8 Conclusion. 87 |
Type de document : | Mémoire master |
Disponibilité (1)
Cote | Support | Localisation | Statut |
---|---|---|---|
MINF/572 | Mémoire master | bibliothèque sciences exactes | Consultable |