Module 1 — Fondements mathématiques et statistiques
- Maîtriser l'algèbre linéaire appliquée au ML (vecteurs, matrices, décompositions).
- Comprendre les distributions de probabilité et les tests statistiques.
- Appliquer le calcul différentiel pour la descente de gradient.
- Comprendre le biais-variance tradeoff et la régularisation.
Module 2 — Algorithmes supervisés
- Implémenter la régression linéaire et logistique.
- Maîtriser les arbres de décision, Random Forest et Gradient Boosting (XGBoost, LightGBM).
- Comprendre les SVMs et les KNN.
- Choisir le bon algorithme selon le problème et les données.
Module 3 — Algorithmes non supervisés et réduction de dimensionnalité
- Appliquer le clustering K-Means, DBSCAN et hiérarchique.
- Réduire la dimensionnalité avec PCA, t-SNE et UMAP.
- Détecter les anomalies avec Isolation Forest et Autoencoders.
- Utiliser les règles d'association pour le market basket analysis.
Module 4 — Évaluation, optimisation et validation
- Maîtriser les métriques d'évaluation (accuracy, F1, AUC-ROC, RMSE).
- Implémenter la validation croisée et le hold-out.
- Optimiser les hyperparamètres avec GridSearch et Optuna.
- Gérer le déséquilibre des classes et les données manquantes.
Module 5 — Pipelines ML et déploiement
- Construire des pipelines ML reproductibles avec Scikit-Learn.
- Tracker les expériences avec MLflow.
- Sérialiser et versionner les modèles.
- Déployer un modèle ML via une API REST.
- Projet final : pipeline ML complet de l'exploration à la mise en production.
Un programme adapté à votre niveau réel
Ce programme est indicatif. Pour un parcours vraiment sur mesure, commencez par vous entraîner et évaluer votre niveau avec le quiz CodeDuel. Contactez-nous ensuite — notre IA détecte précisément vos gaps et nous construisons un programme adapté à votre niveau réel.