Titre : | La Prédiction Bio-informatique de Fonctions de Protéines |
Auteurs : | SOFIANE OUHALIMA, Auteur ; Saliha Belounnar, Directeur de thèse |
Type de document : | Monographie imprimée |
Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2019 |
Format : | 1 vol. (68 p.) / ill. / 29 cm |
Langues: | Français |
Mots-clés: | prédiction,famille récepteur couplé aux protéines G (RCPG),composition en pseudo acides aminés(PseAAC),SVM,Apprentissage. |
Résumé : |
La prédiction de la fonction des gènes et des protéines est un champ de recherche qui sert de pointe de départ aux analyses expérimentales pour élucider les activités biochimiques et les processus pour lesquels sont impliqués les protéines, elles jouent un rôle primordial dans la compréhension des protéines responsables des maladies, de développer les médicaments les plus efficaces et avoir une médecine préventive contre les fléaux éventuels.Les méthodes de prédiction des fonctions à grandement évoluer au cours des temps notamment avec l'arrivée de la génomique, l'apparition de données obtenues à grande échelle, le développement des outils bio-informatique pour traiter le sujet de la classification ayant trait à la famille récepteur couplée aux protéines G (RCPG), choisir une méthode de sélection des caractéristiques composition en pseudo acides aminés (PseAAC)qui peut être déterminant car une méthode appropriée permet d'améliorer grandement les performances de la classification, en utilisant la méthode de classification supervisée machine à vecteurs de support (SVM) pour mettre en oeuvre l'apprentissage., les taux de classification que nous avons trouvé montre que nos résultats sont compétitifs. |
Sommaire : |
Introduction Générale III Chapitre I : Bioinformatique et fonction des protéines 1.1 Introduction 2 1.2 Bioinformatique 2 1.2.1 définition Bioinformatique 2 1.2.2 objectifs de la bioinformatique 3 1.3 La génomique 3 1.3.1 Acide désoxyribonucléique (ADN) - 3 1.3.2 Gènes : 4 1.3.3 Génome 4 1.3.4 Acide ribonucléique (L'ARN) . 4 1.4. La protéomique 5 1.4.1 Les protéines: 6 1.4.2 Les acides aminés 7 1.5 De la génomique vers la protéomique 10 1.6 Prédiction des fonctions de protéines . 11 1.6.1 Classification des protéines suivant leurs fonctions 12 1.6.1.1 Les fonctions moléculaires 12 1.6.1.2 Les Fonctions phénotypiques 12 1.6.1.3 Les fonctions cellulaires 12 1.6.2 Les concepts et techniques de la bioinformatique: 13 1.6.3 Les bases de données biologiques 14 1.7 Les récepteurs couplés aux protéines g 14 1.7.1 Définition 15 1.7.2 Classification RCPG 15 1.7.3 Structure des RCPGs 17 1.7.4 Protéines G 18 1.7.5 Transduction du signal par les protéines G 18 1.7.6 La base de données RCPGs 18 1.8 Objectif de l'étude de la fonction des protéines 19 1.9 Conclusion 19 Chapitre II : Classification HA Introduction 21 11.2 Fouille de données 21 11.2.1 Les techniques de fouille des données 21 11.3 Classification 21 11.3.1 Classification supervisée et non supervisée 22 11.4. La classification non supervisée 22 11.4.1 Clustering 22 11.4.1.1 Le clustering hiérarchique 22 11.4.1.2 Le clustering par partitionnement 23 11.4.2 Exemple des méthodes de classification non supervisée 23 11.4.2.1 K-means 23 11.5.2.2 K-médoides 23 11.5 La classification supervisée 23 11.5.1 Notions de classification supervisée 23 11.5.2 définition de classification supervisée 24 11.5.3 Méthodes de classification supervisée 24 11.5.3.1 Arbre de décision 24 11.5.3.2 Séparateurs à Vaste Marge 25 11.5.3.3 Les réseaux de neurones 25 11.5.3.4 La classification bayé sienne naïve 26 11.5.3.5 k plus proches voisins (k-PPV) 27 11.6 Domaines d'application 28 11.7 Conclusion 28 Chapitre III : Les Séparateurs à Vaste Marge (SVM) III.1. Introduction 30 111.2. Notions sur l'apprentissage statistique. 30 111.3. Application des SVM à la classification binaire 30 111.3.1 Définition 30 111.3.2 SVM Principe de fonctionnement général 31 111.3.3 Pourquoi maximiser la marge? 33 111.4 Linéarité et non linéarité 33 111.4.1 Fondements mathématiques 34 111.4.1.1 Cas de données linéairement séparable 34 111.4.1.2 Le passage du primal vers le dual • 35 111.4.1.3 Cas de données non linéairement séparables 36 111.4.2 Fonction noyau 36 111.4.2.1 Exemples de noyaux 37 111.5. SVM multi-classes 37 111.5.1 Approche Un Contre Tous (1 vsR) 3 8 111.5.2 Approche Un contre Un (lvsl) 39 111.5.3 Graphe de décision 40 111.5.4 SVMs basées sur les arbres de décision 41 111.6 Avantages et inconvénients de SVM 42 111.6 .1 Avantages 42 111.6 .2 Inconvénients 42 111.7 Conclusion 42 Chapitre IV : Conception IV.1 Introduction 44 IV.2 Représentation du système 44 IV.3 Conception globale 44 IV.3.1 Fichier d'accès 45 IV.3.2 Pré-traitement 45 IV.3.3 Classification 45 IV.3.4 Méthode de séparation 45 IV.3.5 Utilisation 45 IV.4 Conception détaillé 45 IV.4. I Fichier d'accès 47 IV.4.2 Pré-traitement 48 IV.4.2. I Sélection des caractéristiques 48 IV.4.2.2 La Normalisation 49 IV.4.3 La méthode de classification SVM 50 IV.4.3.1 La méthode de la séparation des données 50 IV.4.3.2 Le choix de noyau (kernel) 50 IV.4.4 Classification SVM multi classes (1vR) 50 IV. 5 Conclusion 50 Chapitre V : Implémentation V.1 Introduction 52 V.2 L'implémentation du prétraitement 52 V.2 .1 Sélection des caractéristiques 52 V .2.2 Normalisation 53 V.3 Description sur le jeu de données V.4 Présentation de la machine utilisée: 54 V.5 Outils et environnement de programmation 54 V.5.1 Matlab 54 V.5.1.1 Bibliothèque LIBSVM utilisée 55 V.5.1.1.1Train SVM 55 V.5.1.1.2 SVM classifier 56 V.5.1.2 La boite à outil Guide 56 V.5.2 L'outil weka 56 V.6 Description de l'application 57 V.6.1 L'interface graphique 57 V.6.2 Résultats Expérimentaux 59 V.6.2.1 Résultats du langage Matlab 59 V.6.2.2 Résultats du weka 60 V.7 Discussion 61 V.8 Conclusion 61 Conclusion Générale 63 Bibliographie 65 |
Type de document : | Mémoire master |
Disponibilité (1)
Cote | Support | Localisation | Statut |
---|---|---|---|
MINF/430 | Mémoire master | bibliothèque sciences exactes | Consultable |