Titre : | Ontological approach to detect plagiarism between Arabic documents based on semantic similarity |
Auteurs : | Mohamed Akram Khelili, Auteur ; Khaled Rezeg, Directeur de thèse |
Type de document : | Monographie imprimée |
Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2019 |
Format : | 1 vol. (82 p.) / ill. / 29 cm |
Langues: | Anglais |
Mots-clés: | Arabic Documents,Arabic Ontology,Semantic Indexing,Semantic Similarity,Plagiarism Detection. |
Résumé : |
In the context of Arabic plagiarism detection systems (APDS) using an Arabic ontology, and permitting these systems to support semantic representation, to better verify the originality of the research and meet the needs of researchers, this thesis aims to semantically index documents by selecting the best elements from Arabic WordNet. We have analyzed each sentence in the document, have extracted Part-of-Speech (PoS), have extracted Arabic WordNet synonyms for each word and then we have created the first index. The latter is then used by the Lucene program to create the second index, which is used to detect plagiarism in Arabic documents.Our experience is based on a corpus of Arabic text, which we have manually created with the interaction of an expert. The results obtained showed us that the proposed system has proved its performance and its efficacy in detecting the plagiarism in Arabic documents. |
Sommaire : |
1 General Introduction 1 2 Ontology 3 2.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 2.3 The components of an ontology . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.4 Ontology description languages . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4 2.4.1 The RDF language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.4.1.1 RDF structure . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.4.1.2 RDF syntax . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.4.2 The OWL language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5 2.4.2.1 Syntax of OWL . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.5 Protégé-2000 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.6 Ontology vs Database . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6 2.6.1 Database . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7 2.6.2 Unique Name Assumption (UNA) . . . . . . . . . . . . . . . . . . . . . . 7 2.6.3 Close World Assumption (CWA) . . . . . . . . . . . . . . . . . . . . . . . 7 2.6.4 Open World Assumption (OWA) . . . . . . . . . . . . . . . . . . . . . . . 7 2.6.5 Difference between ontology and database . . . . . . . . . . . . . . . . . . 8 2.7 Ontology creation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.7.1 Specification . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.7.2 Conceptualization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.7.3 Implementation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.7.4 Maintenance . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9 2.8 Motivation for the use of the ontology . . . . . . . . . . . . . . . . . . . . . . . . 13 2.9 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 13 3 Plagiarism 14 3.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3.2 Definition . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14 3.3 Citation . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.3.1 The importance of citing sources . . . . . . . . . . . . . . . . . . . . . . . 15 3.4 Intellectual property . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 15 3.4.1 Literary and artistic property . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.4.2 Industrial property . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.5 Copyright laws . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.6 The different forms of plagiarism . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 3.7 What make the student plagiarize . . . . . . . . . . . . . . . . . . . . . . . . . . 17 3.7.1 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17 4 Plagiarism and Arabic Language 19 4.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 4.2 Arabic language . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19 4.2.1 Characteristics of Arabic language . . . . . . . . . . . . . . . . . . . . . . 19 4.3 Plagiarism techniques and related works . . . . . . . . . . . . . . . . . . . . . . . 20 4.4 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23 5 Conception of El Momayaz System 24 5.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 5.2 Purpose of the system . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24 5.3 Overall design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25 5.3.1 General principle of the system . . . . . . . . . . . . . . . . . . . . . . . . 25 5.3.2 General architecture of the system . . . . . . . . . . . . . . . . . . . . . . 25 5.4 Detailed design . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 5.4.1 NLP layer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27 5.4.2 Indexing layer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29 5.4.3 Semantic similarity layer . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31 5.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32 6 Implementation 33 6.1 Introduction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 6.2 Environments, Tools, and Apis used . . . . . . . . . . . . . . . . . . . . . . . . . 33 6.2.1 JAVA . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33 6.2.1.1 Java platforms . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34 6.2.2 Eclipse . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 6.2.3 Lucene . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35 6.2.4 ArabicWordNet . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36 6.3 The interfaces of our system . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 6.3.1 The first interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37 6.3.2 The Login interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40 6.3.3 The Admin interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42 6.3.4 The Stem interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 6.3.5 The Synonyms interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47 6.3.6 The Check Document interface . . . . . . . . . . . . . . . . . . . . . . . . 48 6.3.7 The Add Document interface . . . . . . . . . . . . . . . . . . . . . . . . . 58 6.3.8 The User interface . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62 6.4 Evaluation and Results . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71 6.4.1 Our method algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 6.4.2 Cosine method algorithm . . . . . . . . . . . . . . . . . . . . . . . . . . . 73 6.5 Conclusion . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75 7 General Conclusion 76 Bibliography 78 Bibliography 78 |
Type de document : | Mémoire master |
Disponibilité (1)
Cote | Support | Localisation | Statut |
---|---|---|---|
MINF/475 | Mémoire master | bibliothèque sciences exactes | Consultable |