Titre : | Indexation sémantique des documents semi-structurés XML |
Auteurs : | Hind Salem, Auteur ; Belkacem Abdelli, Directeur de thèse |
Type de document : | Monographie imprimée |
Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2017 |
Format : | 1 vol. (91 p.) / 30 cm |
Langues: | Français |
Sommaire : |
Introduction Générale 1 1 Recherche d'information dans les documents semi-structurés XML 6 1.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 1.2 Recherche d'information . . . . . . . . . . . . . . . . . . . . . . . . . 7 1.2.1 Notions de base de la recherche d'information (RI) . . . . . . 7 1.2.1.1 C'est quoi une recherche d'information (RI) ? . . . . 7 1.2.1.2 But de recherche d'information (RI) . . . . . . . . . 8 1.2.1.3 Système de recherche d'information (RI) . . . . . . 8 1.2.1.4 Processus de recherche d'information . . . . . . . . 9 1.2.2 Principales Notions du processus de recherche d'information . 10 1.2.2.1 Collection des documents . . . . . . . . . . . . . . . 10 1.2.2.2 L'expression du besoin d'information ? Requête ? . 10 1.2.2.3 Indexation . . . . . . . . . . . . . . . . . . . . . . . 10 1.2.2.4 Appariement requête/document . . . . . . . . . . . 13 1.3 Evaluation d'un système de Recherche d'Information . . . . . . . . . 14 1.3.1 Corpus de test . . . . . . . . . . . . . . . . . . . . . . . . . . 14 1.3.1.1 Un ensemble de documents . . . . . . . . . . . . . . 14 1.3.1.2 Un ensemble de requêtes . . . . . . . . . . . . . . . 14 1.3.1.3 La liste de documents pertinents pour chaque requête Jugements de pertinence . . . . . . . . . . 15 1.4 Indexation et recherche d'information dans les documents semi-structurés(XML) . . . . . . . . . . . . . . . . . 15 1.4.1 Problématique de la recherche d'information dans les documents XML . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.4.2 Documents semi-structurés (XML) . . . . . . . . . . . . . . . 17 1.4.2.1 Qu'est-ce-qu'un document semi-structuré (XML) . . 17 1.4.2.2 Description de la structure des documents semi-structurés (XML) . . . . . . . . . . . . . . . . . . . . . . . . . 18 1.4.3 Spécificités de la recherche dans les documents semi-structurés (XML) . . . . .. . . . . . .. . . . . . . . . . . . . 20 1.4.4 Indexation des documents semi-structurés (XML) . . . . . . . 22 1.4.4.1 Indexation de l'information textuelle . . . . . . . . . 22 1.4.4.2 Indexation de l'information structurelle . . . . . . . 24 1.5 Recherche sémantique d'information . . . . . . . . . . . . . . . . . . 26 1.5.1 Motivations . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26 1.5.2 Les notions de base de recherche sémantique d'information . . 27 1.5.2.1 Concept vs terme . . . . . . . . . . . . . . . . . . . 27 1.5.2.2 Indexation classique vs indexation sémantique . . . 28 1.5.3 Ressource sémantique . . . . . . . . . . . . . . . . . . . . . . 29 1.5.3.1 Ontologie . . . . . . . . . . . . . . . . . . . . . . . . 29 1.5.3.2 Types d'ontologie . . . . . . . . . . . . . . . . . . . 29 1.5.4 Mesure de similarité . . . . . . . . . . . . . . . . . . . . . . . 30 1.5.4.1 Notion de la similarité sémantique entre les concepts 30 1.5.4.2 Techniques de calcul des mesures de similarité sémantique . . . .. . . . . . . . . . . . . . . . 31 1.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 2 Travaux connexes 33 2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 2.2 Travaux connexes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 2.2.1 Approches orientées contenu . . . . . . . . . . . . . . . . . . 34 2.2.2 Approches orientées structure . . . . . . . . . . . . . . . . . . 35 2.2.3 Approches orientées structure et contenu . . . . . . . . . . . 36 2.2.3.1 Travail du Rami HARATHI . . . . . . . . . . . . . . 36 2.2.4 Utilisation du contexte pour l'indexation sémantique des images et vidéos (Abdelkader Hamadi, 2015) . . . . . . . . . . . . . . 37 2.3 Approche de notre travail . . . . . . . . . . . . . . . . . . . . . . . . 40 2.3.1 Dénitions . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 2.3.2 Description générale du travail . . . . . . . . . . . . . . . . . 41 2.3.2.1 Ressource sémantique . . . . . . . . . . . . . . . . . 42 2.3.2.2 Outil de la similarité sémantique . . . . . . . . . . . 43 2.3.2.3 Caractéristiques de notre travail . . . . . . . . . . . 43 2.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 3 Conception du système 45 3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45 3.2 Conception globale . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46 3.2.1 Principe général du système . . . . . . . . . . . . . . . . . . . 46 3.2.2 Architecture générale du système . . . . . . . . . . . . . . . . 46 3.3 Conception détaillée . . . . . . . . . . . . . . . . . . . . . . . . . . . 48 3.3.1 Normalisation . . . . . . . . . . . . . . . . . . . . . . . . . . 49 3.3.1.1 Repérer les éléments du documents XML (parser) . 49 3.3.2 Représentation des documents . . . . . . . . . . . . . . . . . 54 3.3.2.1 Processus d'identication des termes . . . . . . . . . 54 3.3.2.2 Processus d'analyse du document . . . . . . . . . . 56 3.3.2.3 Utilisation de la ressource sémantique . . . . . . . . 58 3.3.3 Construction de l'index . . . . . . . . . . . . . . . . . . . . . 62 3.3.3.1 La segmentation en champs (Fields) . . . . . . . . . 62 3.3.4 Représentation de la requête . . . . . . . . . . . . . . . . . . 64 3.3.5 Processus d'appariement n÷ud / requête . . . . . . . . . . . 65 3.3.5.1 Résultat obtenu sans l'utilisation de WordNet . . . . 65 3.3.5.2 Résultat obtenu avec l'utilisation de WordNet . . . . 67 3.4 Diagrammes de cas d'utilisation . . . . . . . . . . . . . . . . . . . . . 68 3.5 Diagramme de séquence . . . . . . . . . . . . . . . . . . . . . . . . . 70 3.6 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 4 Expérimentation et Implémentation 72 4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 72 4.2 Langage de programmation . . . . . . . . . . . . . . . . . . . . . . . 72 4.3 Environnement de développement . . . . . . . . . . . . . . . . . . . 73 4.3.1 Netbeans IDE 8.0.2 . . . . . . . . . . . . . . . . . . . . . . . 73 4.3.2 Serveur local Xampp . . . . . . . . . . . . . . . . . . . . . . . 73 4.3.3 La plateforme lucene . . . . . . . . . . . . . . . . . . . . . . . 74 4.3.4 WordNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 74 4.4 Présentation des interfaces de notre système . . . . . . . . . . . . . . 75 4.4.1 Interface de notre application . . . . . . . . . . . . . . . . . . 75 4.4.2 Interface d'authentication d'administrateur . . . . . . . . . . 75 4.4.2.1 Interface de gestion des documents . . . . . . . . . . 76 4.4.2.2 Interface de représentation des documents . . . . . . 77 4.4.2.3 Interface d'indexation . . . . . . . . . . . . . . . . . 79 4.4.3 Interface d'Inscription d'un Utilisateur . . . . . . . . . . . . . 81 4.4.3.1 Interface Prole Utilisateur . . . . . . . . . . . . . . 82 4.4.3.2 Interface de recherche . . . . . . . . . . . . . . . . . 82 4.4.3.3 Interface d'évaluation . . . . . . . . . . . . . . . . . 85 4.4.4 Évaluation des résultats . . . . . . . . . . . . . . . . . . . . . 86 4.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87 Conclusion Générale 88 Bibliographie 90 |
Disponibilité (1)
Cote | Support | Localisation | Statut |
---|---|---|---|
MINF/283 | Mémoire master | bibliothèque sciences exactes | Consultable |