Support & Downloads

Quisque actraqum nunc no dolor sit ametaugue dolor. Lorem ipsum dolor sit amet, consyect etur adipiscing elit.

s f

Contact Info
198 West 21th Street, Suite 721
New York, NY 10010
youremail@yourdomain.com
+88 (0) 101 0000 000
Follow Us

Big Data - Analyse de données

réf : BDT-BDA

Objectif de formation : Appréhender les enjeux et intérêts du Big Data, puis découvrir les différents outils.

Objectifs pédagogiques

  • Maîtriser les notions clés et les intérêts du Big Data vis-à-vis des enjeux métiers
  • Appréhender l’environnement technologique nécessaire pour créer et déployer un projet Big Data
  • Détenir les connaissances techniques pour manipuler et administrer des flux de données complexes, non structurés et massifs
  • Mettre en oeuvre des modèles d’analyses statistiques pour répondre aux besoins métiers
  • Manipuler un outil de data visualisation pour concevoir des analyses dynamiques

Pré-requis

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation

Connaissances de base des concepts de la Business Intelligence

Public concerné

Dataminers, chargés d’études statistiques, développeurs, chefs de projets, consultants en informatique décisionnel…

Programme

  • Histoire et terminologie du Big Data
  • Le Big Data aujourd’hui : chiffres clés Monde et France
  • Tour d’horizon des enjeux du Big Data

Travaux pratiques

Analyse d’une architecture Big Data

  • Étude de l’architecture et des composants d’Hadoop
  • Présentation des modes de stockage
  • Principes de fonctionnement de MapReduce, Spark, Storm…
  • Tour d’horizon des différentes distributions du marché
  • Installation d’une plateforme Hadoop
  • Datascientist : missions et défis
  • Introduction aux technologies spécifiques pour la data visualisation

Travaux pratiques

Implémentation d’une plateforme Big Data Hadoop…

  • Fonctionnement de Hadoop Distributed File System
  • Importation des données externes vers HDFS
  • Déployer des requêtes SQL avec HIVE
  • Utilisation de PIG pour le traitement de la donnée
  • Principe des ETL
  • Utilisation de streaming de données massive

Travaux pratiques

Mise en oeuvre de flux de données massives

  • Introduction au Machine Learning & à l’IA
  • Régression, Classification & Clustering
  • Travail en amont : préparation des données
  • Génération des modèles en R ou Python
  • Ensemble Learning
  • Présentation des outils du marché

Travaux pratiques

Mise en oeuvre d’analyses

  • Définition du besoin de la data visualisation
  • Analyse & visualisation des données
  • Types de données & DataViz
  • Présentation des outils de DataViz du marché

Travaux pratiques :

Implémentation & utilisation d’un outil de Data Visualisation pour concevoir des analyses dynamiques

  • Bonnes pratiques

Équipe pédagogique

Professionnel expert technique et pédagogique

Moyens pédagogiques et techniques

  • Espace intranet de formation.
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Dispositif de suivi

  • Émargement numérique.
  • Mises en situation.
  • Formulaires d’évaluation de la formation.
  • Certificat de réalisation de l’action de formation.

Vous avez une question ?