Aperçu du cours
Objectif de formation : Cette formation vous permettra d’appréhender et d’appliquer les algorithmes de machine learning (apprentissage automatique) avec la librairie scikit-learn.
Programme d'études
-
Introduction à l’apprentissage automatique
-
Historique et motivations
-
Panorama des différents types d’apprentissage
-
L’apprentissage supervisé : classification vs. régression
-
Exemples concrets
-
-
Les modèles classiques
-
Modèles linéaires
-
Arbres de décision et modèles sous-jacents
-
Support vecteur machines (SVMs) et leurs kernels
-
Quelques modèles très utilisés dans l’industrie
-
-
La réduction de dimensions
-
La malédiction de la dimension
-
Variables corrélées / décorrélées du problème
-
L’apprentissage non-supervisé : PCA & Manifold projection
-
-
Pré-traitement des données
-
Normalisation
-
Encodage des variables qualitatives
-
Augmentation de données
-
Traiter les données manquantes
-
-
Pipelines scikit-learn
-
Découverte du Pipeline scikit-learn
-
Enchainement de pré-traitement et d’entrainement de modèle
-
Visualisation du Pipeline
-
Introduction du ColumnTransformer
-
-
Sélection des modèles
-
Théorème du “No-free lunch”
-
Comparer des modèles
-
Scores / métriques de performance
-
-
Optimisation des modèles
-
Les hyper-paramètres
-
Recherche en grille (grid search) vs. aléatoire (random search)
-
Recherche d’hyperparamètres et cross-validation grâce au Pipeline
-
Visualisation des résultats avec parallel plots (ex : plotly ou hiplots)
-