Support & Downloads

Quisque actraqum nunc no dolor sit ametaugue dolor. Lorem ipsum dolor sit amet, consyect etur adipiscing elit.

s f

Contact Info
198 West 21th Street, Suite 721
New York, NY 10010
youremail@yourdomain.com
+88 (0) 101 0000 000
Follow Us

Big Data - Data classification

réf : BDT-DCL
Formation Squash - Gestion des tests fonctionnels

Objectif de formation : Appréhender le Machine Learning du point de vue du traitement de la donnée ainsi qu’au processus de modélisation statistique.

Objectifs pédagogiques

  • Savoir définir les étapes de préparation des données
  • Comprendre et mettre en oeuvre l’apprentissage automatique
  • Appréhender les techniques de classification de données
  • Comprendre les apports des réseaux de neurones et du Deep Learning

Pré-requis

Connaissances des principes du Big Data et des architectures techniques

Public concerné

Développeur, chefs de projets, Data scientists, architectes…

Programme

  • Zoom sur les données
  • Présentation des requêtes
  • Attentes des utilisateurs
  • Étapes de la préparation des données
  • Définitions, présentation du data munging
  • Rôle du data scientist
  • Qualité des données
  • Transformation de l’information en donnée
  • Qualification et enrichissement
  • Sécurisation et étanchéité des lacs de données
  • Flux de données et organisation dans l’entreprise
  • Donnée maître à la donnée de travail
  • Mise en oeuvre pratique des différentes phases : nettoyage, enrichissement, organisation des données
  • Introduction aux calculs statistiques
  • Paramètres des fonctions
  • Applications aux fermes de calculs distribués
  • Problématiques induites
  • Approximations
  • Précision des estimations
  • Besoin, apports et enjeux
  • Extraction et organisation des classes de données
  • Analyse factorielle
  • Apprentissage automatique
  • Définition & les attentes par rapport au Machine Learning
  • Valeurs d’observation et variables cibles
  • Ingénierie des variables
  • Apprentissage supervisé et non supervisé
  • Classification des données
  • Panorama des différents algorithmes
  • Conception de jeux d’essai, entraînement et construction de modèles
  • Prévisions à partir de données réelles
  • Mesure de l’efficacité des algorithmes
  • Courbes ROC
  • Parallélisation des algorithmes & Choix automatique
  • Introduction aux réseaux de neurones
  • Réseaux de neurones à convolution
  • Modèles de CNN
  • Types de couches
  • Deep Learning & Deeplearning4j sur Spark
  • Importance de la préparation des données
  • Surapprentissage
  • Intérêt de la visualisation
  • Outils disponibles

Équipe pédagogique

Professionnel expert technique et pédagogique

Moyens pédagogiques et techniques

  • Espace intranet de formation.
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Dispositif de suivi

  • Émargement numérique.
  • Mises en situation.
  • Formulaires d’évaluation de la formation.
  • Certificat de réalisation de l’action de formation.

Vous avez une question ?