Avancé

Python Data Science

Maîtrisez Python pour la data science — manipulation, analyse et visualisation de données à l'échelle professionnelle.

Durée estimée
4 jours — 28h
📊
Niveau
Avancé
🎓
Parcours associé

Objectifs pédagogiques

  • Maîtriser Python pour la manipulation et l'analyse de données.
  • Analyser et nettoyer des datasets complexes avec Pandas.
  • Visualiser les données avec Matplotlib, Seaborn et Plotly.
  • Utiliser NumPy et Pandas en contexte de production.
  • Préparer les données pour le Machine Learning.

Prérequis

  • Bases Python (variables, fonctions, boucles, POO).
  • Notions de statistiques descriptives.

Programme indicatif

Module 1 — Environnement Data Science et Python avancé
  • Configurer un environnement Data Science professionnel (Jupyter, VSCode, conda).
  • Maîtriser les structures de données Python avancées (listes, dicts, sets, tuples).
  • Utiliser les compréhensions de liste et les générateurs pour le traitement efficace.
  • Gérer les fichiers CSV, JSON, Excel et Parquet.
Module 2 — NumPy pour le calcul scientifique
  • Créer et manipuler des arrays NumPy multidimensionnels.
  • Effectuer des opérations vectorisées et matricielles.
  • Utiliser les fonctions statistiques et mathématiques de NumPy.
  • Optimiser les performances avec NumPy vs boucles Python.
Module 3 — Pandas pour la manipulation de données
  • Maîtriser les DataFrames et Series Pandas.
  • Nettoyer et transformer des datasets réels (valeurs manquantes, doublons, types).
  • Effectuer des agrégations, jointures et pivots.
  • Optimiser les performances Pandas pour les grands datasets.
Module 4 — Visualisation et analyse exploratoire
  • Créer des visualisations professionnelles avec Matplotlib et Seaborn.
  • Construire des tableaux de bord interactifs avec Plotly.
  • Réaliser une analyse exploratoire complète (EDA).
  • Communiquer les insights data via des visualisations percutantes.
Module 5 — Préparation des données et pipelines
  • Encoder et normaliser les features pour le Machine Learning.
  • Gérer les déséquilibres de classes et les outliers.
  • Construire des pipelines de préparation avec Scikit-Learn.
  • Projet final : analyse complète d'un dataset métier réel avec rapport et visualisations.
Un programme adapté à votre niveau réel

Ce programme est indicatif. Pour un parcours vraiment sur mesure, commencez par vous entraîner et évaluer votre niveau avec le quiz CodeDuel. Contactez-nous ensuite — notre IA détecte précisément vos gaps et nous construisons un programme adapté à votre niveau réel.

Parcours associé

Cette formation fait partie du parcours Data Engineer.

Voir le parcours complet

Prêt à démarrer ?

Contactez-nous pour construire votre parcours sur mesure.