Avancé

Scikit-Learn

Maîtrisez la bibliothèque ML de référence en Python — construisez, évaluez et déployez des modèles professionnels avec Scikit-Learn.

Durée estimée
3 jours — 21h
📊
Niveau
Avancé
🎓
Parcours associé

Objectifs pédagogiques

  • Maîtriser l'API Scikit-Learn (fit, transform, predict).
  • Construire des pipelines de preprocessing et de modélisation.
  • Évaluer et comparer les modèles avec les métriques adaptées.
  • Optimiser les hyperparamètres.
  • Exporter et déployer les modèles.

Prérequis

  • Python Data Science.
  • Bases du Machine Learning.

Programme indicatif

Module 1 — Architecture Scikit-Learn et API unifiée
  • Comprendre l'API Scikit-Learn : Estimators, Transformers, Predictors.
  • Maîtriser le cycle fit/transform/predict.
  • Explorer les datasets intégrés et charger des données externes.
  • Comprendre la cohérence de l'API pour faciliter l'expérimentation.
Module 2 — Preprocessing et feature engineering
  • Encoder les variables catégorielles (OneHotEncoder, OrdinalEncoder, TargetEncoder).
  • Normaliser et standardiser les features (StandardScaler, MinMaxScaler, RobustScaler).
  • Gérer les valeurs manquantes avec SimpleImputer et KNNImputer.
  • Créer de nouvelles features avec PolynomialFeatures et FunctionTransformer.
Module 3 — Pipelines et ColumnTransformer
  • Construire des pipelines ML avec Pipeline et ColumnTransformer.
  • Appliquer des transformations différentes selon le type de colonne.
  • Éviter le data leakage avec les pipelines.
  • Sérialiser et réutiliser les pipelines avec joblib.
Module 4 — Sélection de modèles et optimisation
  • Comparer les algorithmes avec cross_val_score et cross_validate.
  • Optimiser les hyperparamètres avec GridSearchCV, RandomizedSearchCV et HalvingGridSearchCV.
  • Utiliser les courbes d'apprentissage pour diagnostiquer le surapprentissage.
  • Implémenter l'ensemble learning (Voting, Bagging, Stacking).
Module 5 — Métriques avancées et déploiement
  • Choisir les métriques adaptées au problème (classification, régression, clustering).
  • Analyser les erreurs avec les matrices de confusion et les rapports de classification.
  • Interpréter les modèles avec SHAP et les feature importances.
  • Projet final : pipeline Scikit-Learn complet avec sélection de modèle, optimisation et déploiement API.
Un programme adapté à votre niveau réel

Ce programme est indicatif. Pour un parcours vraiment sur mesure, commencez par vous entraîner et évaluer votre niveau avec le quiz CodeDuel. Contactez-nous ensuite — notre IA détecte précisément vos gaps et nous construisons un programme adapté à votre niveau réel.

Parcours associé

Cette formation fait partie du parcours IA & Machine Learning.

Voir le parcours complet

Prêt à démarrer ?

Contactez-nous pour construire votre parcours sur mesure.