Titre : | Classification of non-coding RNAs using Deep Learning |
Auteurs : | Achouak Abdelkrim, Auteur ; Saliha Belounnar, Directeur de thèse |
Type de document : | Monographie imprimée |
Editeur : | Biskra [Algérie] : Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie, Université Mohamed Khider, 2022 |
Format : | 1 vol. (62 p.) / couv. ill. en coul / 30 cm |
Langues: | Français |
Mots-clés: | Bioinformatique, Les ARNs non-codants, CNN, Classification, Apprentissage profond |
Résumé : |
Les ARN non codants (ARNnc), qui fonctionnent directement comme des ARN sans se traduire en protéines, jouent des rôles divers et cruciaux dans les processus biologiques et médicaux, tels que la détection des maladies et le développement de médicaments. Ainsi, nous présentons ici une analyse comparative entre trois projets qui utilisent des approches d'apprentissage profond pour la classification des ARNnc, et nous essayons ensuite d'implémenter le modèle le plus performant entre eux. Notre modèle est basé sur un concept d'apprentissage supervisé avec une architecture de réseaux de neurones convolutifs (CNN), qui classifie nos données en treize (13) familles d'ARNnc en utilisant des séquences pour extraire les caractéristiques. |
Sommaire : |
List of content Dedications 2 Acknowledgments 3 Abstract 4 Résumé 4 List of content 5 List of Figures 9 List of tables 11 General Introduction 12 Chapter 1 Molecular Biology and Bioinformatics 13 1. Introduction 13 2. Molecular Biology 13 2.1. Molecules 14 2.2. Nucleotides 14 2.2.1. Nitrogen Base 14 2.2.2. Phosphate Group 15 2.2.3. Sugar molecule 15 2.3. Amino acid 16 2.4. DNA 16 2.5. RNA 18 2.5.1. Classes of RNA 19 2.5.2. Coding and non-coding RNAs 20 Coding RNAs 20 Non-Coding RNAs 20 2.6. Genetic information: from gene to protein 21 2.6.1. Genome 21 2.6.2. Chromosome 22 2.6.3. Gene 22 2.6.4. Protein 22 2.6.5. Central Dogma 22 5Transcription 22 Translation 23 3. Bioinformatics 24 3.1. History 24 3.2. What is Bioinformatics? 25 3.3. Different types of problems studied in bioinformatics 26 3.4.Application Domains of Bioinformatics 27 3.4.1. Molecular medicine 27 3.4.2. Gene therapy 27 3.4.3. Drug development 27 3.5. Limitations of bioinformatics 27 Chapter 2 Classification of ncRNAs 29 Introduction 29 1.Deep Learning overview 29 1.1. What is deep learning? 29 1.1.1. Basic Structure of Neural Network 30 1.2.Machine learning approaches 30 1.2.1.Supervised learning 30 Classification 31 Regression 32 1.2.2. Unsupervised learning 33 1.2.3. Reinforcement learning 33 1.3. Deep Neural Network models 34 1.3.1. Multi-Layer Perceptrons (MLP) 34 1.3.2. Convolutional Neural Networks (CNN) 34 1.3.3. Recurrent Neural Networks (RNN) 35 1.4. Machine learning in Bioinformatics 35 2. ncRNA classification methods 36 2.1. Classification based on transcript length 36 2.2. Classification based on association with annotated protein-coding genes 36 2.3. Classification based on function 36 3. Comparative analysis 37 3.1. Similar works 37 3.1.1. nRC Classification tool 37 63.1.2.ncRDense Classification tool 38 3.1.3.RNAcon Classification tool 39 3.2. Comparison 41 3.3. Discussion 41 Chapter 3 Project Design and structure 43 1. Overview and objectives 43 2. Project pipeline 43 2.1. Model Structure 43 3. Data preparation 44 3.1. Rfam repository 45 Step 1: Import the data 45 Step 2: Cleaning the data 45 Step 3: Splitting the data 45 4. Model training 46 4.1. Load Datasets 46 4.2. ConFigure model 46 4.3. Create model 46 4.3.1. Max Pooling 46 4.3.2. Activation 47 4.3.3. Flatten 47 4.3.4. DenseNet 48 4.4. Compile model 48 4.4.1. Loss function: 48 4.4.2. Metrics parameter 49 4.4.3. Optimizer 49 Chapter 4 Implementation and Results 50 1. Implementation 50 1.1. Tools and environments 50 1.1.1. Python 50 1.1.2. Google Colab 50 1.1.3. Tensorflow 51 1.1.4. Keras 51 1.1.5. Pandas 51 1.1.6. NumPy 52 71.1.7. Matplotlib 52 1.2. Dataset 52 2. Results 53 2.1. OneHot encoding example test 53 2.2. Identification of Classes test 54 2.3. Reading data files test 54 2.4. Save npy data to folder numpy_data test 54 2.5. Check shape of each dataset test 55 2.6. Model configuration and creation 55 2.6.1. Model architecture 55 2.7. Model compilation test 57 2.7. Evaluation 58 2.7.1. The first scenario: Evaluation of each test file 58 2.7.2. The Second scenario: Evaluation of each class from each file 59 2.8. Average accuracy analysis 59 3. Conclusion 61 Bibliography 6 |
Disponibilité (1)
Cote | Support | Localisation | Statut |
---|---|---|---|
MINF/774 | Mémoire master | bibliothèque sciences exactes | Consultable |