Avancé

Python Data Science

Maîtrisez Python pour la data science — manipulation, analyse et visualisation de données à l'échelle professionnelle.

⏱

Durée estimée

4 jours — 28h

📊

Niveau

Avancé

🎓

Parcours associé

Data Engineer

Objectifs pédagogiques

Maîtriser Python pour la manipulation et l'analyse de données.
Analyser et nettoyer des datasets complexes avec Pandas.
Visualiser les données avec Matplotlib, Seaborn et Plotly.
Utiliser NumPy et Pandas en contexte de production.
Préparer les données pour le Machine Learning.

Prérequis

Bases Python (variables, fonctions, boucles, POO).
Notions de statistiques descriptives.

Programme indicatif

Module 1 — Environnement Data Science et Python avancé

Configurer un environnement Data Science professionnel (Jupyter, VSCode, conda).
Maîtriser les structures de données Python avancées (listes, dicts, sets, tuples).
Utiliser les compréhensions de liste et les générateurs pour le traitement efficace.
Gérer les fichiers CSV, JSON, Excel et Parquet.

Module 2 — NumPy pour le calcul scientifique

Créer et manipuler des arrays NumPy multidimensionnels.
Effectuer des opérations vectorisées et matricielles.
Utiliser les fonctions statistiques et mathématiques de NumPy.
Optimiser les performances avec NumPy vs boucles Python.

Module 3 — Pandas pour la manipulation de données

Maîtriser les DataFrames et Series Pandas.
Nettoyer et transformer des datasets réels (valeurs manquantes, doublons, types).
Effectuer des agrégations, jointures et pivots.
Optimiser les performances Pandas pour les grands datasets.

Module 4 — Visualisation et analyse exploratoire

Créer des visualisations professionnelles avec Matplotlib et Seaborn.
Construire des tableaux de bord interactifs avec Plotly.
Réaliser une analyse exploratoire complète (EDA).
Communiquer les insights data via des visualisations percutantes.

Module 5 — Préparation des données et pipelines

Encoder et normaliser les features pour le Machine Learning.
Gérer les déséquilibres de classes et les outliers.
Construire des pipelines de préparation avec Scikit-Learn.
Projet final : analyse complète d'un dataset métier réel avec rapport et visualisations.

Un programme adapté à votre niveau réel

Ce programme est indicatif. Pour un parcours vraiment sur mesure, commencez par vous entraîner et évaluer votre niveau avec le quiz CodeDuel. Contactez-nous ensuite — notre IA détecte précisément vos gaps et nous construisons un programme adapté à votre niveau réel.

S'entraîner sur CodeDuel Demander une évaluation

Parcours associé

Cette formation fait partie du parcours Data Engineer.

Voir le parcours complet

Prêt à démarrer ?

Contactez-nous pour construire votre parcours sur mesure.

Demander un devis Voir toutes les formations