Description
Objectif de formation : Appréhender le Machine Learning du point de vue du traitement de la donnée ainsi qu’au processus de modélisation statistique
Objectifs pédagogiques
- Savoir définir les étapes de préparation des données
- Comprendre et mettre en oeuvre l’apprentissage automatique
- Appréhender les techniques de classification de données
- Comprendre les apports des réseaux de neurones et du Deep Learning
Public concerné
Chefs de projets
Développeurs
Data scientists
Architectes
Prérequis
Connaissances des principes du Big Data et des architectures techniques
Déroulé du programme
1
Introduction
- Zoom sur les données
- Présentation des requêtes
- Attentes des utilisateurs
- Étapes de la préparation des données
- Définitions, présentation du data munging
- Rôle du data scientist
2
Gouvernance des données
- Qualité des données
- Transformation de l’information en donnée
- Qualification et enrichissement
- Sécurisation et étanchéité des lacs de données
- Flux de données et organisation dans l’entreprise
- Donnée maître à la donnée de travail
- Mise en oeuvre pratique des différentes phases : nettoyage, enrichissement, organisation des données
3
Traitements statistiques de base
- Introduction aux calculs statistiques
- Paramètres des fonctions
- Applications aux fermes de calculs distribués
- Problématiques induites
- Approximations
- Précision des estimations
4
Data Mining
- Besoin, apports et enjeux
- Extraction et organisation des classes de données
- Analyse factorielle
5
Machine Learning
- Apprentissage automatique
- Définition & les attentes par rapport au Machine Learning
- Valeurs d’observation et variables cibles
- Ingénierie des variables
- Apprentissage supervisé et non supervisé
- Classification des données
- Panorama des différents algorithmes
- Conception de jeux d’essai, entraînement et construction de modèles
- Prévisions à partir de données réelles
- Mesure de l’efficacité des algorithmes
- Courbes ROC
- Parallélisation des algorithmes. Choix automatique.
6
IA
- Introduction aux réseaux de neurones
- Réseaux de neurones à convolution
- Modèles de CNN
- Types de couches
- Deep Learning & Deeplearning4j sur Spark
7
Risques & erreurs à éviter
- Importance de la préparation des données
- Surapprentissage
8
Visualisation des données
- Intérêt de la visualisation
- Outils disponibles
Informations
Durée
2 jour(s)
14h
Tarif
1500 € HT
HT
Formations similaires
IA & Data
Migration vers le Cloud
2 jour(s)
Sur demande
IA & Data
Agents IA — Concevoir des systèmes autonomes avec LangChain et LangGraph - Avancé
3 jour(s)
Sur demande
IA & Data
AI Act européen — Comprendre vos obligations et vous mettre en conformité - Niveau débutant
1 jour(s)
Sur demande
IA & Data
Analyse des données avec Microsoft Power BI (4-167)
3 jour(s)
2200 € HT