Titre : | La classification SVM des données bio-puces |
Auteurs : | Mohamed Abdelaziz Saouli, Auteur ; Saliha Belounnar, Directeur de thèse |
Type de document : | Monographie imprimée |
Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2018 |
Format : | 1 vol. (65 p.) / 30 cm |
Langues: | Français |
Résumé : |
|
Sommaire : |
La table des figures………………………………………………….….….…………….……..ii Introduction Générale…………………………………………………..….…………….……iii Chapitre I : La bioinformatique et les bio-puces………………………..…………………….2 I.1 Introduction………………………………………….…………………...…………......…....2 I.2. La bioinformatique…………………………………..……………………………..…….....2 I.2.1. Définition de la Bioinformatique…….……………...…………………………..………..2 I.3. La génomique………………………….……………………………………….…………..4 I.3.1. La cellule……………………………..…………………………………….…………….4 I.3.2. Acide désoxyribonucléique(ADN)….…………………………………………………...4 I.3.3. Structure primaire de l’ADN…………..……….………………………………………..5 I.3.4. Gènes…...……………………………….…………………………………………….....5 I.3.5. Génome………………………………………………………….……………………....5 I.3.6. Acide ribonucléique(L’ARN messager )………………………...……………………...5 I.3.7. Transcriptome………………………………………………..….……………………...6 I.3.8. La méthode PCR………………………………………..……….….……………….....6 I.4. Les puces à ADN……………………………………..…………..…….………………..6 I.4.1. Introduction……………………………………..………………....…..……………....6 I.4.2. Les puces à ADN…………………………..………………………..….……………..6 I.4.3. Les étapes d’une analyse à puces ADN………………..…………….…..……………7 I.4.3.1 La préparation des sondes………………………..………………….….…….……..7 I.4.3.2 La préparation des cibles et l’hybridation…...………………………………………....8 I.4.3.3 Acquisition et analyse des images……………………………………….……...……...9 I.4.3.4 Transformation des données……………………………………………..……...…….10 I.4.4. Plateformes……………………………………………………………...……………...11 I.4.4.1 Technologie Agilent…………………………………………………...….…………..11 I.4.4.2 Technologie Affymetrix…………………………………………………….…….......11 I.4.5. Gestion et partages des données…………………………………………….....…….....11 I.4.5.1Microarray gène expression data society (La MGED)…...................................……...12 I.4.5.2 Gene express omnibus(CEO)…..…………………………...………………..……....12 I.4.6. Prétraitement des données et Normalisation…………………………………..……....13 I.4.6.1 Etapes du prétraitement des données..……………………………………………….13 I.4.6.1.1 Correction du bruit de fond (Background Correction)……………...……………..13 I.4.6.1.2 Normalisation………………………………………………………...…………....13 I.4.6.1.2.1 Normalisation des quantiles (quantiles normalization)……………...…………..14 I.4.6.1.3 Le filtrage…………………………………………………………………….....…14 I.4.6.1.4 Sélection des attributs pour traitement des données…………………………....…15 I.4.6.1.4.1 T-test…………………………………………………………………….............15 I.4.6.1.4.2 SAM…………………………………………………………………..……........15 I.4.7. Présentation des données de puces à ADN………………………….…….……..…...16 I.4.8. Analyse des données……………………………………………….……….…...........16 I.5. Conclusion………………………………………………………….……..…….……...16 Chapitre II : Classification………………………………………….………..………........18 II.1. Introduction…………………………………………………….………..……….....…19 II.2. Classification………………………………………………….……….………...…....19 II.3. Les méthodes de classification……………………………….……….………...…….19 II.4. La classification non supervisée……………………………………………….………19 II.4.1. Le clustering hiérarchique………………………………...………………………....19 II.4.2. Le clustering par partitionnement………………………...…...……….……............20 II.4.2.1 la méthode du K-moyennes……………………………......……….………...........20 II.4.2.2 L’algorithme des centres mobiles……………………….……….……..................20 II.4.2.3 la méthode du K-médoides………………………...………….………..................21 II.5. La classification supervisée………………………..………….……………..……….21 II.5.1. Définition de la classification supervisée………..…………………….….………..21 II.5.2. Les techniques de la classification supervisée…………………………..……........23 II.5.2.1 KPPV…………………………………………..…………………...….……....…23 II.5.2.2 L’apprentissage bayésien .....................................................................................24 II.5.2.3 Les arbres de décision………………………………………...…….…....……..24 II.5.2.3Les réseaux de neurones……….…….……………………………….…………..25 II.5.2.4 Méthode des SVMs …………….…………………………………….…............26 II.6. Conclusion……………………..……………………………………….….……….26 Chapitre III : machine à vecteur de support……..….………………………………...27 III.1. Introduction…………………………………….………………………………….28 III.2. SVM principe de fonctionnement général……...…………………………............28 III.2.1. Notions de base: Hyperplan, marge et support vecteur…………….…….…......28 III.2.1.1 Hyperplan optimal…………………………………………………………......28 III.2.1.2 Les Support de vecteurs …………………………………...…………….…....29 III.2.1.3 La marge………………………………………………...……………….........29 III.2.1.4 Pourquoi maximiser la marge ?.........................................................................30 III.2.2 Apprentissage statistique et SVM………………………………………....…….31 III.2.3 Principe du SVM………………………………………………………………...31 III.3 Linéarité et non-linéarité……………………………………………….………….32 III.3.1. Cas linéairement séparable………………...…………….….…….…….............33 III.3.2 Problème primal………………………………………………….……………..33 III.3.3 Problème dual……………………….………………………….………...…….34 III.3.4 Cas non séparable………………...……….………………......………………..35 III.3.5 Cas non linéairement séparable…………………..………….…………………36 III.3.6 Fonction de noyau………………………...…………….….….…………….....37 III.3.6.1 Condition pour avoir un noyau (théorème de Mercer)………..….…………..38 III.3.6.2 Exemple de noyau………………………………………….……………......39 III.4. SVM multi-classes…………………………………………..……...…………...40 III.4.1La méthode Une-contre-reste (one-versus-all)……………..…..………............40 III.4.2 La méthode Une-contre-une (one versus-one)………………………...............41 III.5 Les avantages et les inconvénients……………………...………………............41 III.5.1 Avantages………………………………………..…...…………….................41 III.5.2. Inconvénients…………………………… ..………..……….……………….42 III.6. Les domaines d’applications…………..………......…….……...……...............42 III.7. Conclusion………………………...……………….……………………...........42 Chapitre IV : La conception du système …………...….…………………………....43 IV.1. Introduction………………………………...…….………………...…..............44 IV.2. Description du système………… ………………………………......................44 IV.3. La conception globale………………….………………………………………44 IV.3.1. Le fichier GEO d’entrée……………………………………………………..45 IV.3.2. Prétraitement………………………………………………………………...45 IV.3.3. Méthode de la classification…….…………. ………....................................46 IV.3.3.1 Séparation des données…………...………………………..…….…..........46 IV.3.3.2 Classification SVM………………….…….………………………...........46 IV.4. Conception détaillé…………… …………….……………..………..............46 IV.4.1. Le fichier d’entrée…………………………………………………...........48 IV.4.2. Le prétraitement des données………………………….…………............49 IV.4.2.1 correction du bruit du fond………………...….………………..............49 IV.4.2.2 Normalisation…………………………………………………………..50 IV.4.2.3 Le filtrage………………………...……………………………….........50 IV.4.2.4 Sélection……………………..…………………………………............50 IV.4.3. La méthode de classification……………………………………….........50 IV.4.3.1 Les méthodes de la séparation des données…….……………...............51 IV.4.3.2 La fonction noyau (karnel) ……………....……………...………........51 IV.4.3.3 Classification SVM………………..……...…………………………...51 IV.5 Conclusion……………………..……………...………………….…........51 Chapitre V : Implémentation…...…..……… ...……………………....…........52 V.1 Introduction…………………..……………………………………............53 V.2 L’environnement de travail………….………..…………………...............53 V.3 Le langage de codage………….…………………………………..............53 V.4 Caractéristique de la Machine…….……………..………………..............53 V.5 Présentation de l’interface de l’application…..……………….................54 V.6 Conclusion…………………………...…..……………………................58 Conclusion Général……………………… .………………………………..60 Bibliographie…………………………….………………………………….62 |
Disponibilité (1)
Cote | Support | Localisation | Statut |
---|---|---|---|
MINF/389 | Mémoire master | bibliothèque sciences exactes | Consultable |