Avancé

Scikit-Learn

Maîtrisez la bibliothèque ML de référence en Python — construisez, évaluez et déployez des modèles professionnels avec Scikit-Learn.

⏱

Durée estimée

3 jours — 21h

📊

Niveau

Avancé

🎓

Parcours associé

IA & Machine Learning

Objectifs pédagogiques

Maîtriser l'API Scikit-Learn (fit, transform, predict).
Construire des pipelines de preprocessing et de modélisation.
Évaluer et comparer les modèles avec les métriques adaptées.
Optimiser les hyperparamètres.
Exporter et déployer les modèles.

Prérequis

Python Data Science.
Bases du Machine Learning.

Programme indicatif

Module 1 — Architecture Scikit-Learn et API unifiée

Comprendre l'API Scikit-Learn : Estimators, Transformers, Predictors.
Maîtriser le cycle fit/transform/predict.
Explorer les datasets intégrés et charger des données externes.
Comprendre la cohérence de l'API pour faciliter l'expérimentation.

Module 2 — Preprocessing et feature engineering

Encoder les variables catégorielles (OneHotEncoder, OrdinalEncoder, TargetEncoder).
Normaliser et standardiser les features (StandardScaler, MinMaxScaler, RobustScaler).
Gérer les valeurs manquantes avec SimpleImputer et KNNImputer.
Créer de nouvelles features avec PolynomialFeatures et FunctionTransformer.

Module 3 — Pipelines et ColumnTransformer

Construire des pipelines ML avec Pipeline et ColumnTransformer.
Appliquer des transformations différentes selon le type de colonne.
Éviter le data leakage avec les pipelines.
Sérialiser et réutiliser les pipelines avec joblib.

Module 4 — Sélection de modèles et optimisation

Comparer les algorithmes avec cross_val_score et cross_validate.
Optimiser les hyperparamètres avec GridSearchCV, RandomizedSearchCV et HalvingGridSearchCV.
Utiliser les courbes d'apprentissage pour diagnostiquer le surapprentissage.
Implémenter l'ensemble learning (Voting, Bagging, Stacking).

Module 5 — Métriques avancées et déploiement

Choisir les métriques adaptées au problème (classification, régression, clustering).
Analyser les erreurs avec les matrices de confusion et les rapports de classification.
Interpréter les modèles avec SHAP et les feature importances.
Projet final : pipeline Scikit-Learn complet avec sélection de modèle, optimisation et déploiement API.

Un programme adapté à votre niveau réel

Ce programme est indicatif. Pour un parcours vraiment sur mesure, commencez par vous entraîner et évaluer votre niveau avec le quiz CodeDuel. Contactez-nous ensuite — notre IA détecte précisément vos gaps et nous construisons un programme adapté à votre niveau réel.

S'entraîner sur CodeDuel Demander une évaluation

Parcours associé

Cette formation fait partie du parcours IA & Machine Learning.

Voir le parcours complet

Prêt à démarrer ?

Contactez-nous pour construire votre parcours sur mesure.

Demander un devis Voir toutes les formations