Formation en IA & Data: Big Data - Data classification - Ascent Formation
Retour aux formations
IA & Data

Big Data - Data classification

2 jour(s)14h

Description

Objectif de formation : Appréhender le Machine Learning du point de vue du traitement de la donnée ainsi qu’au processus de modélisation statistique

Objectifs pédagogiques

  • Savoir définir les étapes de préparation des données
  • Comprendre et mettre en oeuvre l’apprentissage automatique
  • Appréhender les techniques de classification de données
  • Comprendre les apports des réseaux de neurones et du Deep Learning

Public concerné

Chefs de projets
Développeurs
Data scientists
Architectes

Prérequis

Connaissances des principes du Big Data et des architectures techniques

Déroulé du programme

1

Introduction

  • Zoom sur les données
  • Présentation des requêtes
  • Attentes des utilisateurs
  • Étapes de la préparation des données
  • Définitions, présentation du data munging
  • Rôle du data scientist
2

Gouvernance des données

  • Qualité des données
  • Transformation de l’information en donnée
  • Qualification et enrichissement
  • Sécurisation et étanchéité des lacs de données
  • Flux de données et organisation dans l’entreprise
  • Donnée maître à la donnée de travail
  • Mise en oeuvre pratique des différentes phases : nettoyage, enrichissement, organisation des données
3

Traitements statistiques de base

  • Introduction aux calculs statistiques
  • Paramètres des fonctions
  • Applications aux fermes de calculs distribués
  • Problématiques induites
  • Approximations
  • Précision des estimations
4

Data Mining

  • Besoin, apports et enjeux
  • Extraction et organisation des classes de données
  • Analyse factorielle
5

Machine Learning

  • Apprentissage automatique
  • Définition & les attentes par rapport au Machine Learning
  • Valeurs d’observation et variables cibles
  • Ingénierie des variables
  • Apprentissage supervisé et non supervisé
  • Classification des données
  • Panorama des différents algorithmes
  • Conception de jeux d’essai, entraînement et construction de modèles
  • Prévisions à partir de données réelles
  • Mesure de l’efficacité des algorithmes
  • Courbes ROC
  • Parallélisation des algorithmes. Choix automatique.
6

IA

  • Introduction aux réseaux de neurones
  • Réseaux de neurones à convolution
  • Modèles de CNN
  • Types de couches
  • Deep Learning & Deeplearning4j sur Spark
7

Risques & erreurs à éviter

  • Importance de la préparation des données
  • Surapprentissage
8

Visualisation des données

  • Intérêt de la visualisation
  • Outils disponibles

Informations

Durée

2 jour(s)

14h

Tarif

1500 € HT

HT