Titre : | Le langage R au quotidien : traitement et analyse de données volumineuses |
Auteurs : | Olivier Decourt, Auteur |
Type de document : | Monographie imprimée |
Editeur : | Paris [France] : Dunod, 2018 |
Collection : | InfoPro |
Sous-collection : | Applications Métiers |
ISBN/ISSN/EAN : | 978-2-10-077076-2 |
Format : | 1 vol. (283 p.) / couv. ill. en coul. / 25 cm |
Note générale : | Index |
Langues: | Français |
Index. décimale : | 006.312 |
Catégories : |
[Agneaux] Analyse des données [Agneaux] Données massives > Gestion |
Mots-clés: | R (logiciel),Manuels d'enseignement supérieur,Statistique mathématique,Informatique Statistique,Logiciels Données massives,Gestion Analyse des données |
Résumé : |
Un guide pour apprendre à utiliser le langage R pour produire des statistiques descriptives. Il aborde les principes du langage, les types de données, les outils les plus courants et propose des exercices sur un volume important de données, disponibles en ligne. |
Sommaire : |
P. 11. Avant-propos P. 13. Données utilisées comme exemples dans ce livre Première partie P. 17. Découvrir R P. 19. 1 Introduction à R P. 13. 1.1 Origines de R P. 19. 1.1.1 R et S-Plus P. 19. 1.1.2 CRAN et projet R P. 20. 1.1.3 Logiciels utilisant le langage R P. 21. 1.2 Fichiers gérés par R P. 21. 1.2.1 Scripts P. 21. 1.2.2 Objets P. 21. 1.2.3 Environnements P. 22. 1.2.4 Historique de commandes P. 22. 1.2.5 Gestion de la mémoire P. 22. 1.3 Interfaces pour la programmation R P. 22. 1.3.1 Interface R basique P. 24. 1.3.2 Interface RStudio P. 33. 2 Principes du langage P. 33. 2.1 Scripts P. 33. 2.1.1 Ponctuation des scripts et règles d'écriture P. 34. 2.1.2 Commentaires P. 34. 2.1.3 Conventions de notation de syntaxe dans ce livre P. 34. 2.2 Stockage d'information P. 34. 2.2.1 Notion d'objet P. 35. 2.2.2 Noms des objets P. 35. 2.2.3 Supprimer un objet P. 35. 2.3 Fonctions : dans R tout est fonction P. 35. 2.3.1 Fonctions et opérateurs P. 36. 2.3.2 Résultat d'une fonction, affectation P. 36. 2.3.3 Appel de fonction, transfert d'arguments, ellipse P. 37. 2.3.4 Fonctions génériques P. 38. 2.3.5 Vectorisation P. 38. 2.3.6 Création de fonctions P. 39. 2.4 Packages P. 39. 2.4.1 Principe d'un package P. 39. 2.4.2 Récupération d'un package P. 40. 2.4.3 Chargement d'un package P. 41. 2.4.4 Packages utilisés dans ce livre P. 44. 2.4.5 Version des packages P. 44. 2.4.6 Identification « du » bon package P. 46. 2.5 Principaux types de données P. 46. 2.5.1 Textes P. 46. 2.5.2 Numériques et entiers P. 46. 2.5.3 Dates P. 47. 2.5.4 Booléens P. 47. 2.5.5 Facteurs P. 48. 2.5.6 Formules P. 48. 2.5.7 Chemins P. 49. 2.5.8 Valeurs spéciales P. 49. 2.5.9 Conversions P. 50. 2.6 Principales structures de données P. 50. 2.6.1 Vecteurs et listes P. 51. 2.6.2 Matrices et arrays P. 51. 2.6.3 Data.frame, data.table, tibbles P. 52. 2.6.4 Types spécifiques à des fonctions P. 52. 2.6.5 Fonctions de conversion Deuxième partie P. 53. Manipuler des données P. 55. 3 Récupération de données P. 55. 3.1 Import de fichiers externes P. 55. 3.1.1 Fichiers plats P. 60. 3.1.2 Classeurs Excel P. 61. 3.1.3 Fichiers statistiques : SAS, SPSS et Stata P. 63. 3.2 Connexion à une base de données P. 64. 3.3 Récupération d'objets R sauvegardés P. 64. 3.3.1 Fichiers Rdata P. 65. 3.3.2 Fichiers RDS P. 67. 4 Filtres et requêtes P. 67. 4.1 Listes et résumés de données P. 67. 4.1.1 Liste de données P. 70. 4.1.2 Affichage du type des données P. 72. 4.1.3 Statistiques sommaires P. 73. 4.1.4 Taille et noms associés à un objet P. 74. 4.2 Dimensions entre [ ] P. 74. 4.2.1 Utilisation d'indices P. 74. 4.2.2 Utilisation de booléens P. 75. 4.2.3 Utilisation de noms d'éléments P. 75. 4.2.4 Utilisation des crochets selon le type d'objet manipulé P. 82. 4.3 Filtres et conditions P. 82. 4.3.1 Utilisation d'indices à partir d'une condition P. 85. 4.3.2 Filtres avec la fonction subset P. 87. 4.3.3 Filtres avec le package dplyr P. 90. 4.3.4 Filtres sur un data.table P. 93. 4.3.5 Choix de la meilleure syntaxe P. 95. 4.4 Tirages d'échantillons P. 99. 5 Création de variables P. 99. 5.1 Vie des variables P. 99. 5.1.1 Création de variables P. 101. 5.1.2 Changement de nom de certaines variables P. 102. 5.1.3 Suppression de variables P. 103. 5.2 Formules systématiques P. 103. 5.2.1 Fonctions pour les nombres P. 107. 5.2.2 Fonctions pour les textes P. 113. 5.2.3 Fonctions pour les Dates P. 119. 5.2.4 Conversions P. 121. 5.2.5 Gestion des facteurs P. 127. 5.2.6 Gestion des valeurs manquantes P. 128. 5.3 Formules conditionnelles P. 128. 5.3.1 Condition unique P. 129. 5.3.2 Conditions multiples P. 130. 5.3.3 Affectation partielle P. 131. 5.3.4 Appartenance à un quantile P. 131. 5.4 Rangs, cumuls et blocs P. 132. 5.4.1 Rangs P. 133. 5.4.2 Cumuls P. 134. 5.4.3 Repérage dans des blocs P. 136. 5.4.4 Opérations par blocs P. 137. 5.5 Vectorisation P. 140. 5.6 Création d'une fonction sur mesure P. 143. 6 Tri, jointure et transposition P. 143. 6.1 Tri et doublons P. 143. 6.1.1 Tri simple P. 146. 6.1.2 Tri d'un data.table P. 147. 6.1.3 Repérage et suppression de doublons P. 148. 6.2 Empilement et jointure : combiner des données P. 149. 6.2.1 Empilement P. 150. 6.2.2 Jointures P. 154. 6.3 Transposition P. 155. 6.3.1 Verticalisation P. 157. 6.3.2 Pivot et statistiques Troisième partie P. 161. Produire des statistiques et des graphiques P. 163. 7. Statistiques descriptives P. 163. 7.1 Statistiques simples P. 163. 7.1.1 Fonctions de base P. 165. 7.1.2 Gestion des données manquantes P. 166. 7.1.3 Production de plusieurs statistiques à la fois P. 169. 7.1.4 Production des mêmes statistiques sur toutes les variables P. 172. 7.2 Statistiques par groupes P. 172. 7.2.1 Cas général P. 174. 7.2.2 Agrégations statistiques avec le package dplyr P. 177. 7.2.3 Cas particulier des data.tables P. 179. 7.3 Tableaux de fréquence P. 179. 7.3.1 Fréquences et proportions P. 182. 7.3.2 Tableaux complets P. 184. 7.4 Tableaux statistiques sur mesure P. 184. 7.4.1 Organisation du tableau P. 186. 7.4.2 Statistiques du tableau P. 188. 7.4.3 Esthétique du tableau P. 191. 8 Graphiques P. 191. 8.1 Packages graphiques et paramètres P. 191. 8.1.1 Différents packages, différentes logiques P. 191. 8.1.2 Paramètres graphiques P. 193. 8.2 Nuages de points et courbes P. 193. 8.2.1 Nuages de points P. 197. 8.2.2 Courbes P. 199. 8.3 Diagrammes en bâtons et circulaires P. 199. 8.3.1 Diagrammes en bâtons P. 205. 8.3.2 Diagrammes circulaires ou camemberts P. 207. 8.3.3 Nuages de points qualitatifs ou dot plots P. 209. 8.4 Graphiques statistiques P. 209. 8.4.1 Histogrammes P. 210. 8.4.2 Boîtes à moustaches ou boxplots P. 212. 8.5 Ajout d'éléments personnalisés P. 212. 8.5.1 Titres P. 214. 8.5.2 Marqueurs isolés P. 216. 8.5.3 Lignes de référence P. 219. 8.5.4 Légende P. 222. 8.5.5 Axes P. 224. 8.6 Introduction au package ggplot2 P. 224. 8.6.1 Grammaire des graphiques P. 226. 8.6.2 Nuage de points P. 227. 8.6.3 Courbes P. 229. 8.6.4 Diagrammes en bâtons P. 232. 8.6.5 Boîtes à moustaches P. 235. 8.6.6 Éclatement ou facetting P. 239. 9 Export et reporting P. 239. 9.1 Sauvegarde et export de données P. 239. 9.1.1 Sauvegarde d'objets P. 240. 9.1.2 Export vers Excel P. 243. 9.1.3 Export en fichier plat P. 244. 9.2 Reporting P. 246. 9.2.1 Construction d'un document Rmd P. 253. 9.2.2 Insertion de résultats dans un document Rmd P. 258. 9.2.3 Création d'un document Word ou PowerPoint avec ReporteRs P. 265. 9.2.4 Insertion de résultats dans un document ReporteRs P. 272. 9.2.5 Reporting interactif avec shiny P. 277. Index |
Disponibilité (2)
Cote | Support | Localisation | Statut |
---|---|---|---|
INF/703 | Livre | bibliothèque sciences exactes | Consultable |
INF/703 | Livre | bibliothèque sciences exactes | Empruntable |
Les abonnés qui ont emprunté ce document ont également emprunté :
Recherche d'information | Amini, Massih-Reza |