Titre : | Reconnaissance de caractères de sous-titres vidéo en utilisant l’apprentissage automatique. |
Auteurs : | MOHAMED AMINE BOUZID SALMI, Auteur ; Ahmed Tibermacine, Directeur de thèse |
Type de document : | Monographie imprimée |
Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2020 |
Format : | 1 vol. (96 p.) / ill. / 29 cm |
Langues: | Français |
Résumé : | Une tâche importante dans l’indexation vidéo basée sur le contenu est d’extraire des informations textuelles des vidéos. Les défis de l’extraction et de la reconnaissance de texte sont la variation de l’éclairage sur chaque cadre vidéo avec du texte, le texte présent sur le fond complexe et la taille de police différente du texte. Nous avons développé un système de reconnaissance de caractères de sous-titre vidéo, spécifiquement adapté pour détecter et reconnaitre les textes incrustés. Reposant sur des approches d’apprentissage profond pour la reconnaissance de caractères. La segmentation, l’extraction des caractéristiques et la classification sont les principales étapes de la reconnaissance des caractères. Plusieurs résultats expérimentaux démontrent la performance des algorithmes proposés. |
Sommaire : |
1.1 INTRODUCTION ................................................. 12
1.2 OBJECTIF DE L’APPRENTISSAGE MACHINE ............................. 12 1.3 DIFFERENTS TYPES D’APPRENTISSAGE .................................. 13 1.3.1 Apprentissage supervisé ....................................... 13 1.3.2 Apprentissage non supervisé ................................ 14 1.3.3 Apprentissage semi-supervisé ....................................... 15 1.3.4 Apprentissage par renforcement ................................... 17 1.4 GENERALISATION ................................................ 17 1.4.1 Sur-apprentissage ............................................. 17 1.4.2 Régularisation .............................................. 19 1.4.3 Malédiction de la dimensionnalité .................. 20 1.5 DIFFERENTS TYPES DE MODELES .................................... 22 1.5.1 Modèles paramétriques ................................. 22 1.5.2 Modelés non paramétriques ............................ 22 1.6 ALGORITHMES D’APPRENTISSAGE ..................................... 23 1.6.1 Réseaux de neurones ............................................ 23 1.6.2 Machines de Boltzmann restreintes ................... 26 1.6.3 Architectures profondes (Deep Learning) ................ 27 1.6.4 K-plus proches voisins .............................................. 28 1.6.5 Fenêtres de Parzen ............................................... 29 1.6.6 Mélanges de Gaussiennes ..................................... 30 1.6.7 Méthodes à noyau .................................................. 30 1.6.8 Arbres de décision ............................................... 31 1.6.9 Méthodes Bayésiennes ...................................... 32 1.7 CONCLUSION ....................................................... 33 2 CHAPITRE 02 : RECONNAISSANCE DES FORMES. ..................... 34 2.1 INTRODUCTION .................................................... 35 2.2 RECONNAISSANCE DES FORMES (RF) ................................ 35 2.2.1 Définition .............................................................. 35 2.2.2 Historique ................................................................ 36 2.3 METHODES .................................................................... 37 2.4 LA RECONNAISSANCE DE PLUSIEURS OBJETS DANS UNE IMAGE ........... 37 2.5 APPLICATION TYPIQUE DE LA RECONNAISSANCE DES FORMES ................... 38 2.5.1 Marketing .......................................................... 38 2.5.2 Finances ........................................................... 38 2.5.3 Usinage ....................................................... 38 2.5.4 Energie ................................................................. 38 2.5.5 Lecture automatisée ......................................... 38 2.5.6 Sécurité ............................................................... 38 2.6 SCHEMA GENERAL D’UN SYSTEME DE RECONNAISSANCE DES FORMES ......... 39 2.6.1 Préparation des données ................................... 39 2.6.2 Apprentissage ........................................................ 40 2.6.3 Classification .......................................................... 40 2.6.4 Post traitement .............................................. 40 2.7 LA VIDEO....................................................................... 41 2.7.1 Caractéristiques de la vidéo .............................. 41 2.8 TRAITEMENT D’IMAGE ................................................... 41 2.8.1 Définition de l’image .............................................. 42 2.8.2 Acquisition d’une image ..................................... 43 2.8.3 Caractéristiques d’une image numérique................. 44 2.8.4 Système de traitement d’images .................................. 46 2.9 SEGMENTATION DES IMAGES ........................................... 47 2.9.1 Types de Segmentation ............................................ 47 2.9.2 Les principes de la segmentation ............................. 48 2.10 RECONNAISSANCE DE CARACTERES DE SOUS-TITRES VIDEO .................. 48 2.10.1 Travaux connexes ............................................. 48 2.10.2 Comparaison entres les travaux réalisés ......... 49 2.11 CONCLUSION .............................................................. 50 3 CHAPITRE 03 : CONCEPTION ET IMPLEMENTATION. ............... 51 3.1 INTRODUCTION ............................................................. 52 3.2 CONCEPTION GENERALE DE NOTRE SYSTEME .................... 52 3.3 CONCEPTION DETAILLE ................................................ 54 3.3.1 Extraction des images de la vidéo .................... 54 3.3.2 Prétraitement d’image ........................................... 54 3.3.3 Segmentation ...................................................... 55 3.3.4 Reconnaissance ................................................ 56 3.4 SYSTEME DE RECONNAISSANCE A BASE DE RESEAU NEURONAL CONVOLUTIF ............ 57 3.4.1 Architecture d’un CNN traditionnel ..................... 57 3.4.2 Les couches de réseaux de neurones convolutionnels ........ 58 3.4.3 Paramètres du filtre .......................................... 60 3.4.4 Fonctions d’activation ................................................. 63 3.4.5 Pourquoi les réseaux de neurones convolutionnel (CNN) ? .......... 64 3.4.6 L’architecture de CNN proposé .............................. 65 3.5 DES ASTUCES D’APPRENTISSAGE PROFOND ............................. 67 3.5.1 Traitement des données ......................................... 67 3.5.2 Entraîner un réseau de neurones ...................... 68 3.6 LA BASE DE DONNEES................................................... 70 3.7 LANGAGE, LOGICIELS ET LIBRAIRIES UTILISES DANS L’IMPLEMENTATION ........ 71 3.7.1 Python .......................................................... 71 3.7.2 Tensorflow ....................................................... 71 3.7.3 Keras ................................................................... 71 3.7.4 PIL .......... 72 3.7.5 OpenCV ................................................... 72 3.7.6 Tkinter ........................................... 72 3.7.7 PyCharm ......................................... 72 3.7.8 Configuration utilisée dans l’implémentation ....................... 73 3.8 RESULTAT OBTENU POUR LE MODELE DE CNN .................................. 73 3.8.1 Les limites de réseau de neuronal convolutionnel .................... 74 3.9 SYSTEME DE RECONNAISSANCE A BASE DE RESEAU NEURONAL A CAPSULE (CAPSNET) 75 3.9.1 Capsules .......................................................... 75 3.9.2 Routage dynamique entre les capsules ...................... 82 3.9.3 L’architecture de CapsNet ......................................... 84 3.9.4 Fonction de perte (Perte de marge) ...................... 84 3.9.5 L’architecture de CAPSNET proposé ......................... 85 3.10 RESULTAT ET DISCUSSION ............................................. 89 3.10.1 Résultat obtenu pour le modèle de CAPSNET ................ 89 3.10.2 Tableau de comparaison de résultats ............... 90 3.11 CONCLUSION ............................................ 91 BIBLIOGRAPHIE .................................................. 93 |
Type de document : | Mémoire master |
Disponibilité (1)
Cote | Support | Localisation | Statut |
---|---|---|---|
MINF/519 | Mémoire master | bibliothèque sciences exactes | Consultable |