Titre : | Analyse de sentiments dans les commentaires arabes avec une approche d'apprentissage supervisée |
Auteurs : | Soufia Bencharif, Auteur ; Okba Tibemacine, Directeur de thèse |
Type de document : | Monographie imprimée |
Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2017 |
Format : | 1 vol. (64 p.) / 30 cm |
Langues: | Français |
Sommaire : |
Introduction Générale …………………………………………………………………………….1 Chapitre I : Traitement automatique de la langue arabe.....................................……………......3 1.1 Introduction…………………………………………………………….………………...….3 1.2 Langue arabe…………………………………………………………………………...……3 1.2.1 Définition ………………………………………………………………………….…...4 1.3 Problème du traitement automatique de la langue arabe………………….………………..…4 1.3.1 Les sens des mots …………………………………….……….................................... 4 1.3.2 Variation dans la catégorie lexicale ……………………………………………….…..4 1.3.3 La forme de mot selon son mode …………………………………………….…...……5 1.3.4 Ambiguïté causé par l’absence des voyelles ……………………………………...…...5 1.3.5 La chadda …………………………………………………………………………......5 1.3.6 La confusion dans l’écriture de certaines lettres ……..……………………………......6 1.3.7 Le tanwin …………………………………………………….………………………..7 1.3.8 Mots étrangers translitérés en arabe …………………………………………….……..7 1.4 Caractéristiques de la langue arabe ………………………………………………….………7 1.4.1 Particularités …………………………………………………………………………..7 1.4.2 Structure d’un mot arabe …………………………………………………….………10 1.4.3 Les catégories du mot arabe ……………………………………………….…...…....10 1.4.3.1 Nom ( 10 .....….……………………………………………………………… (اسم 1.4.3.2 Verbe ( 11 ...…….…………………………………………………………… (فعل 1.4.3.3 Particules ………………………………………………………………..…....12 1.5 Grammaire d’arabe ………………………..…………………………………………......12 1.5.1 La morphologie ( 12 .......................…………………………………………… (الصرف 1.5.2. La syntaxe, ( 13 ..…..…...………………………………………………… (النحو 1.6 La morphologique de l’arabe ……………………………………………………….….....13 1.6.1 LA RACINE ( 13 ......…...………………………………………………… (الجذر 1.6.2 Les modèles ( 14 ....….......................…………………………………… (الأوزان 1.6.3 Les affixes ……………………………………………………………..…....15 1.6.3.1 Les préfixes / 16 .......……………………………………………… السوابق 1.6.3.2 Les suffixes / 16 ..…......……………..…………………………… اللواحق 1.6.3.3 Stem ( 16 ..…...…………………………………………………… (الجذع 1. 7 L’analyse morphologique en arabe ………………………………………....…...16 1.7.1 Difficulté de l’analyse morphologique de l’arabe ……………………....….16 1.7.1.1 Ambiguïté due au non voyellation …………………………….....…...17 1. 7.1.7 Ambiguïté d’agglutination ……………………………………....…..18 1.7.1.3 Ambiguïté dérivationnelle et flexionnelle ……………………….......18 1.8 Conclusion ……………………………………………...……………………….19 Chapitre II : L’analyse des sentiments …………………………………............................…….20 2.1. Introduction …………………………………………………...........................…20 2.2. Texte mining …………………………………………………….........................20 2.2.1 Définition du texte mining ………………………………..………………..20 2.2.2 Problématique de l’analyse de texte ……………………..………………....20 2.2.3 Pourquoi le texte mining ………………………………….………………..21 2.2.4 Concepts du text mining ……………………………………………………21 2.2.5 Fonctionnement de Text-mining ………………………….………………..22 2.2.5.1 Phase de prétraitement …………………………...………………....22 2.2.5.2 Phase de traitement ……………………………………………….....22 2.2.5.2.1 L’approche statistique…………………………………………… 23 2.2.5.2.2 L’approche sémantique……………………………….………….. 23 2.2.5.3 Phase de visualisation ……………………………………………....23 2.2.6 Outils de text-mining ……………………………………..………………...23 2.2.6.1 Outils de classification …………………………………………..….23 2.2.6.2 Outils de résumé automatique…………………………………..…...24 2.2.6.3 Outils d’extraction de l’information ……………………………..…24 2.2.7 Fonctionnalités du Text Mining …………………………………………...24 2.2.7.1 Clustering ………………………………………………………..…24 2.3.7.2 Analyse de sentiments ………………………………………….......24 2.2.7.3 Extraction de relations ………………………………………….......25 2.2.8 Des cas d’utilisations très variés ……………………………………...…. .25 2.2.9 Technologies du text mining ………………………………………….….25 2.2.9.1 Le traitement du langage naturel ………………………………......25 2.2.9.2 Base de connaissances …………………….…………………...…...26 2.2.9.3 Machine learning ……………………….…....……………….....…26 2.3. Text mining et le traitement du langage …………………………………..…...26 2.4. Analyse des sentiments (opinion mining) …………………….…………..…....27 2.4.1 Problématique ……………………………………………………..……...27 2.4.2 Définition ……………………………………………………………..…..27 2.4.3 Méthode pour l’analyse des sentiments ……………………………...……28 2.4.3.1 Apprentissage automatique (ML) ……………………………….....28 2.4.3.2 Lexicon ………………………………….……................................28 2.4.3.3 Approches hybrides ………………………………………………..28 2.4.4 Approches en détail de la classification de sentiment …………………….29 2.4.4.1 Approche à base de lexicon …………….………………………….29 2.4.4.2 Approche hybride ……………………………..…...........................30 2.4.4.3 Apprentissage automatique ………………………………………..30 2.4.4.4. Approches en traitement de la Langue Naturelle…………………..31 2.4.4.5. Approches supervisées & Support Vector Machines …..…………31 2.4.5 Mécanisme de base de l’analyse des sentiments………………..…………32 2.4.6 Processus d’analyse de sentiment ……………………..………...………...32 2.4.7 Les difficultés rencontrées par l’analyse automatique de sentiment ………33 2.5 Travaux Connexes ……………………………………………………………...33 2.6. Conclusion …………………………………………………………………….39 Chapitre III : Réalisation et Conception ……………………………………………………..40 3.1 Introduction……………………………………………………………………..40 3.2 Dialecte algérien …….………………………………………………………….40 3.2.1 Définition …………………………………………………………………40 3.2.2 Spécifications du dialecte algérien ………………………………………..40 2.3 Objectif du système ……………………………………………………………..44 3.4 Conception globale ……………………………………………………………..45 3.5 Conception détaillés …………………………………………………………….46 3.6 Méthode d'apprentissage SVM …………………………………………………50 3.6.1 SVM (SUPPORT VECTOR MACHINE) ………………………………..50 3.6.2 Étapes et techniques utilisées dans la classification du sentiment …………51 3.6.3 L’évaluation de classifieur ………………………………………………...52 3.6.3.1 Les mesures d’évaluation …………………….…………………..52 3.7 Méthode d’apprentissage naïve bayésienne …………………………………….54 3.7 Conclusion ……………………………………………………………………...56 Chapitre 4 : Implémentation…………………...………………………………………….. 57 4.1 Introduction ……………………………………………………...………………57 4.2 Langage de programmation………………………………………………………57 4.3 Environnement de développement intégré ……………………………………….58 4.4 Outils utilisés …………………………………………………………………….58 4.4.1 XML …………………………………………………………………………58 4.4.2 LibSVM ……………………………………………………………………..58 4.4.2 crawler ……………………………………………………………………….58 4.4.3 Jsoup « Java HTML Parser » ………………………………………………..59 4.4.4 Json « JavaScript Object Notation » …………………………………………59 4.5 Déroulement …………………………………………………………………….59 |
Disponibilité (1)
Cote | Support | Localisation | Statut |
---|---|---|---|
MINF/258 | Mémoire master | bibliothèque sciences exactes | Consultable |