Titre : | Python pour le data scientist - 2e éd. - Des bases du langage au machine learning |
Auteurs : | Emmanuelle Jakobowicz, Auteur |
Type de document : | Monographie imprimée |
Mention d'édition : | 2 édition |
Editeur : | Paris [France] : Dunod, 2021 |
Collection : | InfoPro. Management des systèmes d'information, ISSN 1773-5483 |
ISBN/ISSN/EAN : | 978-2-10-081224-0 |
Format : | 1 vol. (320 p.) / couv. ill. en coul / 24 cm |
Langues: | Français |
Résumé : |
Si vous vous intéressez au traitement des données avec le langage Python, cet ouvrage s’adresse à vous. Que vous soyez débutant en Python ou que vous ayez une expérience significative, il vous apportera les clés pour utiliser ce langage en data science. Ce livre répond à de nombreuses questions sur Python : • Comment utiliser Python en data science ? • Comment coder en Python ? • Comment préparer des données avec Python ? • Comment créer des visualisations attractives avec Python ? • Comment appliquer des modèles de machine learning et de deep learning avec Python ? • Comment passer aux environnements big data ? Vous apprendrez à tirer parti des multiples outils Python tels que Anaconda, Jupyter, NumPy, Pandas, Matplotlib, Seaborn, Bokeh, Scikit-Learn, TensorFlow, PySpark… pour mettre en place vos traitements. Cette deuxième édition est complétée et enrichie par des mises à jour de code liées aux évolutions de Python et des packages de data science. Des données plus récentes sont aussi utilisées. |
Sommaire : |
Le XI PREMIÈRE PARTIE:Les fondamentaux du langage 1.Pythonses origines et son environnement... x 17 Histoire, origines et évolution: de la naissance à le version 3, 9 17 Les origines et l'évolution du langage. 18 La rencontre entre Python et la data science. 18 l'évolution actuelle..." 19 Le futur de Python. 19 2.Python vs R vs le reste du monde. 20 R. _ Le 20 Outils de traitement a flux. 23 SAS. 24 Les autres langages 24 comment développer en Python Pure 25 Les outils pour coder en Python... 27 Python et PyPi. 27 Anaconda 28 (Python. 31 Spyder, Visual Studio Code et PyCharm. 83 Jupyter notebooks… sr 34 JupyterLab: l'évolution des notebook. 40 Les packages pour la data science... 42 Les packages pour la gestion des st et le calcul numérique. Les packages pour la visualisation ueë: AEnESB Les packages pour le machine learning et le desp learnins Les packages pour le big data. Autres packages pour la data science Python from scratch . 45 Principes de base. 45 Un langage interprété, “de haut ni niveau et orienté vb 45 Python 2 ou Python 3 46 DEUXIÈME PARTIE:La préparation et la visualisation des données avec Python Python et les données (NumPy et Pandas)…. La donnée à l'ère de la data science... Le type de données. Le travail de préparation des d données Les arrays de NumPy Le ndarray de NumPy.. Construire Un array. _—. Les types de données dans des arrays… Les propriétés d'un array... Accéder aux éléments d'un array... La manipulation des arrays avec NumPy Copies et vues d'arrays.. sr Quelques opérations d'algèbre inéaire.. Les arrays structurés …. Exporter et importer des arrays. 3-3 Les objets series et dataframe de Pandas. 3.3.1 Les objets Series de Pandas... 3.3.2 Les objets DateFrame dé Panda. 3.3.3 Copie et vue des objets de Pandas La préparation des données et les premières statistiques 107 4.1 Présentation des données. 107 4.1.1 Les locations AirBrB à à Paris. 107 41.2 Les données des employés a la ville de Bosto 108 41.3 Les données des communes d'Île-de-France. 109 41.4 Les données sur les clients d'un opérateurde télécommunications… 109 4.1.5 Les SMS pour la assseston de messages S Hdésiabies —. 110 4:16 La base de données des vêtements Fashion-MNIST. in 4.1.7 Les données de l'indice CAC40 depuis 1987... 11 4-2 Les outils pour charger les données … 112 4.21 Importer des données structurées. 112 42.2 Le traitement des données externes (csv, SQL, xisx, open data...) 112 4.2.3 Charger et transformer des données non structurée (images, sons, json, xml...) 121 4.3 Décrire et transformer des colonnes 126 4-31 Décrire la structure de vos données 126 4.3.2 Quelles transformations pour les colonnes de vos S données 128 4.3.3 Les changements de types. 4.3.4 Les jointures et concaténations 4.3.5 La gestion des duplications de lignes... 4.3.6 La discrétisation 437 Les tris 4.3.8 Le traitement de données Jhompatalsé 4.3.9 Le traitement des données manquantes ne 43.10 Le traitement des colonnes avec des données qualitatives 4.3.1 Les transformations numériques 4.3.12 Échantillonnage des données 4.313 La construction de tableaux croisés 4.4 Extraire des statistiques descriptives: 4.41 Statistiques pour données quantitatives 4.4.2 Statistiques pour données qualitatives. 4.5 Utilisation du groupby pour décrire des données 4.51 Le principe 4.5.2 Les opérations sur les objets érousl lee 4.5.3 Apply: une méthode importante pour manipuler vos groupby … 4.5.4 Cas concret d'utilisation d'un groupby. 4.6 Aller plus loin: accélération. s nes ss 4.6.1 Parallélisation avec Dask et Pandas 4.6.2 Accélération du code avec Numba.. 5.El Data visualisation avec Python 5.1 Construction de graphiques avec Matplotlib.. 5411 Utilisation de Matplotlib… 5.1.2 Afficher des graphiques 5.1.3 Les paramètres globaux de Matplotlib et l'exportation de graphiques. 5.1.4 Votre premier graphique 5.1.5 Nuage de points avec plt.scatter …. 5.1.6 Le graphique en bâtons avec plt.bar() 5.1.7 La construction d'un pie chart 5.1.8 Les barres d'erreurs avec plt.errorbar() 5.19 La construction d'histogrammes 51.10 Personnaliser Vos graphiques Matplotlib 5.111 Créer un graphique animé. 5.2 Seaborn pour des représentations plus élaborées 5.2.4 Utilisation de Seaborn.… 5.2.2 Le box plot ou la boîte à moustaches 5.2.3 Les violons 5.2.4 Les distplot() de Seaborn 5.2.5 Les pairplot(} de Seaborn ou la matrice de graphiques... 189 5.2.6 Les jointplot().… de … … 190 5.3 Quelques bases de erégraphie… SEE ENS 191 5.3.1 Installation et utilisation de Cartopy. 192 5.3.2 Les autres outils. 5.4 Les graphiques interactifs avec d’autres se HSE et outils 197 5.4.1 Les packages utilisés … 197 5.4.2 Création d'une visualisation avec Bokel … 197 5.4.3 Création d'une application web avec Bokeh.…. seu 109 TROISIÈME PARTIEزPython, le machine learning et le big data 6. Différentes utilisations du machine learning avec Python... 205 6.1 Le machine learning, qu'est-ce que c'est ? 205 6.11 Les principes et les familles d'algorithmes 205 6.1.2 Faire du machine learning... D 207 6.2 Comment faire du machine learning avec Python ë . 208 6.2.1 Scikit-Learn 208 6:2.2 TensorFlow… 210 6.2.3 Keras 210 6.2.4 PyTorch… sas 6.3 Le processus de tr traitement en machine learning. 21 6.3.1 Le rôle du data scientist pour les traitements machine (sara 211 6.3.2 Avant les algorithmes: les données …. 21 6.3.3 Quelques règles à respecter lorsqu'on utilise des algorithmes . 212 6.3.4 Le traitement avec Scikit-Learn 214 6.4 L'apprentissage supervisé avec Scikit-Learn 6.4.1 Les données et leur transformation …. 6.4.2 Le choix et l'ajustement de l'algorithme 6.4.3 Les indicateurs pour valider un modèle. 230 6.4.4 l'ajustement des hyperparamètres d'un modèle: 237 6.4.5" La construction d'un pipeline de traitement. co. 240 6.4.6 Passer en production votre modèle d'apprentissage aUBETVEE : 243 6.5 L'apprentissage non supervisé … 245 6.5.1 Le principe 245 6.5.2 implémentation d'une Mano dé Surenng à avec je PHARGR 245 6.5.3 Les méthodes de réduction de dimension. 251 6.6 l'analyse textuelle avec Python rs ends pages 257 6.6.1 Les données textuelles en Python mrmsmense GE 6.6.2 Le prétraitement des données £ ht a 258261 6.6.3 La mise en place d'un premier modèle prédit. 6.6.4 Aller plus loin …….… 6.7 Le deep learning. 6.7.1 Pourquoi le deep learning ?.… 6.7.2 Installer votre environnement : Le 6.7.3 Principe d'un réseau de neurones et première utilisation 6.7.4 Le deep learning et les réseaux de neurones à convolutions.……… 270 6.7.5 Aller plus loin: génération de features, transfer learning,RNN, GAN.......... 274 F] Python et le big data: tour d'horizon... 279 7.1 Est-ce qu'on change tout quand on parle de He data ? 279 7.2 Comment traiter de la donnée massive avec Python. si 280 7.3 Récupérer des données avec Python... s us inenncss 28 7.31 Les approches classiques... Le 281 7.3.2 Se connecter aux fichiers HDFS en Python — Utilisation de PyArrow 282 7.3.3 Faire du Hive avec Python - Utiisation d de pyHie. . mms 208 7.4 Utilisation d'Apache Spark avec PySpark en Python... 284 7.41 Principes de Spark. Dee . D 284 7.4.2 Installer une infratfuétüre Spark. 286 7.43 Le DataFrame de Spark SQL …. 287 7.4.4 Le machine learning avec Spark. 293 Lexique de la data science Lu oo ei 297 Mettre en place votre environnement 301 BOOTS PAIE. non at br mremenaur DOS Index... 309 |
Disponibilité (3)
Cote | Support | Localisation | Statut |
---|---|---|---|
INF/764 | Livre | bibliothèque sciences exactes | Consultable |
INF/764 | Livre | bibliothèque sciences exactes | Empruntable |
INF/764 | Livre | bibliothèque sciences exactes | Empruntable |
Les abonnés qui ont emprunté ce document ont également emprunté :
Android 4 | Meier, Reto |