Formation en IA & Data: Machine Learning - Fondamentaux avec Python et Scikit-Learn - Ascent Formation
Retour aux formations
IA & Data

Machine Learning - Fondamentaux avec Python et Scikit-Learn

3 jour(s)21h

Description

Objectif de formation : Cette formation vous permettra d’appréhender et d’appliquer les algorithmes de machine learning (apprentissage automatique) avec la librairie scikit-learn.

Objectifs pédagogiques

  • Identifier les problèmes pouvant faire appel à l’apprentissage automatique
  • Découvrir les modèles classiques d’apprentissage supervisé
  • Évaluer les performances des modèles d’apprentissage
  • Utiliser la librairie scikit-learn pour comprendre et mettre en oeuvre les différentes étapes d’un traitement de données par apprentissage supervisé

Public concerné

Développeurs
Ingénieurs
Chercheurs
Chefs de projets techniques

Prérequis

Connaissances solides en Python
Facultatif : Connaissances de base en algèbre linéaire
Facultatif : Avoir suivi la formation « Python - Programmation scientifique »

Déroulé du programme

1

Introduction à l’apprentissage automatique

  • Historique et motivations
  • Panorama des différents types d’apprentissage
  • L’apprentissage supervisé : classification vs. régression
  • Exemples concrets
2

Les modèles classiques

  • Modèles linéaires
  • Arbres de décision et modèles sous-jacents
  • Support vecteur machines (SVMs) et leurs kernels
  • Quelques modèles très utilisés dans l’industrie
3

La réduction de dimensions

  • La malédiction de la dimension
  • Variables corrélées / décorrélées du problème
  • L’apprentissage non-supervisé : PCA & Manifold projection
4

Pré-traitement des données

  • Normalisation
  • Encodage des variables qualitatives
  • Augmentation de données
  • Traiter les données manquantes
5

Pipelines scikit-learn

  • Découverte du Pipeline scikit-learn
  • Enchainement de pré-traitement et d’entrainement de modèle
  • Visualisation du Pipeline
  • Introduction du ColumnTransformer
6

Sélection des modèles

  • Théorème du “No-free lunch”
  • Comparer des modèles
  • Scores / métriques de performance
7

Optimisation des modèles

  • Les hyper-paramètres
  • Recherche en grille (grid search) vs. aléatoire (random search)
  • Recherche d’hyperparamètres et cross-validation grâce au Pipeline
  • Visualisation des résultats avec parallel plots (ex : plotly ou hiplots)

Informations

Durée

3 jour(s)

21h

Tarif

2100 € HT

HT