| Titre : | Utilisation de méthodes de Deep learning pour l’extraction de texte dans les images |
| Auteurs : | ABDELOUAHEB MAAMOULI, Auteur |
| Type de document : | Mémoire magistere |
| Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2021 |
| Format : | 1 vol. (330 p.) / ill. / 21 cm |
| Langues: | Français |
| Mots-clés: | apprentissage automatique, apprentissage profond, vision par ordinateur, Détection de texte, Réseaux de neurones convolutifs. |
| Résumé : | En raison de la diversité du texte, de la complexité de la scène et des facteurs de distorsion, la détection de texte est une tâche difficile. La méthode de traitement d'image traditionnelle repose fortement sur des caractéristiques artificielles, ce qui n'est pas universellement applicable à tous les scénarios de texte. Afin de résoudre ce problème, la technologie d'apprentissage en profondeur est appliquée pour apprendre et extraire les caractéristiques des textes de manière adaptative. Dans ce travail, une nouvelle méthode d'apprentissage basée sur Convolution Neural Network (CNN) est proposée pour détecter des textes dans différents scénarios. Des expériences de comparaison de référence sont menées sur quatre ensembles de données populaires, à savoir ICDAR2015, ICDAR2013, MSRA-TD500 et ICDAR2017-MLT. Les résultats indiquent que le modèle proposé surpasse de manière significative les méthodes de pointe en termes d'efficacité de détection tout en maintenant une grande précision ; par exemple, la méthode proposée atteint une précision plus que 80% à 130 fps avec une résolution de 416 p sur l'ensemble de données ICDAR2013, ICDAR2017 et MSRA-TD500. |
| Sommaire : |
CHAPITRE 01 : MACHINE LEARNING Introduction ............................................................................................................... 15
Différents types d’apprentissage ............................................................................... 15 Apprentissage supervisé ......................................................................................... 15 Apprentissage non supervisé .................................................................................. 16 Apprentissage semi-supervisé ................................................................................ 16 Apprentissage par renforcement ............................................................................ 17 Généralisation ............................................................................................................ 17 Sur-apprentissage ................................................................................................... 17 Régularisation ........................................................................................................ 18 Malédiction de la dimensionnalité ......................................................................... 19 Différents types de modèles ...................................................................................... 19 Modèles paramétriques .......................................................................................... 19 Modelés non paramétriques ................................................................................... 20 Algorithmes d’apprentissage ..................................................................................... 20 Machines de Boltzmann restreintes ....................................................................... 20 K-plus proches voisins ........................................................................................... 21 Fenêtres de Parzen ................................................................................................. 22 Mélanges de Gaussiennes ...................................................................................... 23 Méthodes à noyau .................................................................................................. 23 Arbres de décision .................................................................................................. 24 Méthodes Bayésiennes ........................................................................................... 25 Réseaux de neurones artificiels .............................................................................. 25 Deep Learning ........................................................................................................ 26 Domaine d’applications du machine learning ........................................................... 27 Conclusion ................................................................................................................. 29 CHAPITRE 02 : VISION PAR ORDINATEUR Intriductuion .............................................................................................................. 31 Définistion ................................................................................................................. 31 Historique .................................................................................................................. 32 Reconnaissance des formes (RF) ............................................................................... 33 Définition ............................................................................................................... 33 Méthodes ................................................................................................................ 34 La reconnaissance de plusieurs objets dans une image.......................................... 34 Application Typique de la reconnaissance des formes .......................................... 35 Schéma général d’un système de Reconnaissance des Formes ............................. 35 La vidéo ................................................................................................................. 38 Traitement d’image .................................................................................................... 39 Définition de l’image ............................................................................................. 40 Acquisition d’une image ........................................................................................ 41 Caractéristiques d’une image numérique ............................................................... 41 Système de traitement d’images ............................................................................ 44 Segmentation des images ........................................................................................... 44 Types de Segmentation .......................................................................................... 44 Les principes de la segmentation ........................................................................... 45 Détection d’objet ....................................................................................................... 45 Définition ............................................................................................................... 45 Méthodes ................................................................................................................ 45 Travaux connexes ...................................................................................................... 46 1.5.10. Comparaison entres les travaux réalisés ............................................................. 47 1.6. Conclusion ................................................................................................................. 47 CHAPITRE03 : CONCEPTION ET IMPLEMENTATION Introduction ............................................................................................................... 49 Conception générale de notre système ...................................................................... 49 Conception détaillé .................................................................................................... 50 Réseaux de neurones convolutifs(CNN) ................................................................ 51 Architecture de Yolov5 .......................................................................................... 52 Colonne vertébrale (Backbone) ............................................................................. 53 Cou (Neck) ............................................................................................................. 57 Tête (Head) ............................................................................................................ 58 La boîte d'ancrage (Anchor box) ............................................................................ 58 Generalized Intersection over Union ..................................................................... 58 Lissage des étiquettes de classe (Class label smoothing) ...................................... 59 Les bases de données ................................................................................................. 59 Langage , logiciels et libraries utilisée dans l’implémentation.................................. 60 Python .................................................................................................................... 60 PyTorch .................................................................................................................. 60 PIL .......................................................................................................................... 61 OpenCV ................................................................................................................. 61 Google Colab ......................................................................................................... 62 Configuration utilisée dans l’implémentation ........................................................ 62 Résultat ...................................................................................................................... 63 Les étapes pour faire l’apprentissage de modèle ................................................... 63 L’étape pour faire l’extraction de texte .................................................................. 64 Évaluation sur long texte ....................................................................................... 65 Évaluation sur horizontal texte .............................................................................. 67 Évaluation sur orienté texte.................................................................................... 68 Évaluation sur multilingue texte ........................................................................... 69 Conclusion ................................................................................................................. 71 |
| Type de document : | Mémoire master |
Disponibilité (1)
| Cote | Support | Localisation | Statut |
|---|---|---|---|
| MINF/605 | Mémoire master | bibliothèque sciences exactes | Consultable |




