Module 1 — Architecture Scikit-Learn et API unifiée
- Comprendre l'API Scikit-Learn : Estimators, Transformers, Predictors.
- Maîtriser le cycle fit/transform/predict.
- Explorer les datasets intégrés et charger des données externes.
- Comprendre la cohérence de l'API pour faciliter l'expérimentation.
Module 2 — Preprocessing et feature engineering
- Encoder les variables catégorielles (OneHotEncoder, OrdinalEncoder, TargetEncoder).
- Normaliser et standardiser les features (StandardScaler, MinMaxScaler, RobustScaler).
- Gérer les valeurs manquantes avec SimpleImputer et KNNImputer.
- Créer de nouvelles features avec PolynomialFeatures et FunctionTransformer.
Module 3 — Pipelines et ColumnTransformer
- Construire des pipelines ML avec Pipeline et ColumnTransformer.
- Appliquer des transformations différentes selon le type de colonne.
- Éviter le data leakage avec les pipelines.
- Sérialiser et réutiliser les pipelines avec joblib.
Module 4 — Sélection de modèles et optimisation
- Comparer les algorithmes avec cross_val_score et cross_validate.
- Optimiser les hyperparamètres avec GridSearchCV, RandomizedSearchCV et HalvingGridSearchCV.
- Utiliser les courbes d'apprentissage pour diagnostiquer le surapprentissage.
- Implémenter l'ensemble learning (Voting, Bagging, Stacking).
Module 5 — Métriques avancées et déploiement
- Choisir les métriques adaptées au problème (classification, régression, clustering).
- Analyser les erreurs avec les matrices de confusion et les rapports de classification.
- Interpréter les modèles avec SHAP et les feature importances.
- Projet final : pipeline Scikit-Learn complet avec sélection de modèle, optimisation et déploiement API.
Un programme adapté à votre niveau réel
Ce programme est indicatif. Pour un parcours vraiment sur mesure, commencez par vous entraîner et évaluer votre niveau avec le quiz CodeDuel. Contactez-nous ensuite — notre IA détecte précisément vos gaps et nous construisons un programme adapté à votre niveau réel.