Big Data – Analyse de données

0 Enrolled
35 heures
  • 35 heures
  • 32
  • 0
  • no
3,250.00€

Aperçu du cours

Objectif de formation : Appréhender les enjeux et intérêts du Big Data, puis découvrir les différents outils.

Prérequis

  • Connaissances de base des modèles relationnels, des statistiques et des langages de programmation
  • Connaissances de base des concepts de la Business Intelligence

Objectifs pédagogiques

  • Maîtriser les notions clés et les intérêts du Big Data vis-à-vis des enjeux métiers
  • Appréhender l'environnement technologique nécessaire pour créer et déployer un projet Big Data
  • Détenir les connaissances techniques pour manipuler et administrer des flux de données complexes, non structurés et massifs
  • Mettre en oeuvre des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Manipuler un outil de data visualisation pour concevoir des analyses dynamiques

Public ciblé

  • Dataminers
  • Chargés d'études statistiques
  • Développeurs
  • Chefs de projet
  • Consultants en informatique décisionnelle

Programme de formation

  • Introduction : notions & enjeux du Big Data

    • Histoire et terminologie du Big Data

    • Le Big Data aujourd’hui : chiffres clés Monde et France

    • Tour d’horizon des enjeux du Big Data

    • Travaux pratiques : analyse d’une architecture Big Data

  • Technologies du Big Data

    • Étude de l’architecture et des composants d’Hadoop

    • Présentation des modes de stockage

    • Principes de fonctionnement de MapReduce, Spark, Storm…

    • Tour d’horizon des différentes distributions du marché

    • Installation d’une plateforme Hadoop

    • Datascientist : missions et défis

    • Introduction aux technologies spécifiques pour la data visualisation

    • Travaux pratiques : Implémentation d’une plateforme Big Data Hadoop

  • Traitement des données structurées & non structurées

    • Fonctionnement de Hadoop Distributed File System

    • Importation des données externes vers HDFS

    • Déployer des requêtes SQL avec HIVE

    • Utilisation de PIG pour le traitement de la donnée

    • Principe des ETL

    • Utilisation de streaming de données massive

    • Travaux pratiques : Mise en oeuvre de flux de données massives

  • Technique & méthodes Big Data analytics

    • Introduction au Machine Learning & à l’IA

    • Régression, Classification & Clustering

    • Travail en amont : préparation des données

    • Génération des modèles en R ou Python

    • Ensemble Learning

    • Présentation des outils du marché

    • Exercice : Mise en oeuvre d’analyses

  • Data visualisation & cas d'usage concrets

    • Définition du besoin de la data visualisation

    • Analyse & visualisation des données

    • Types de données & DataViz

    • Présentation des outils de DataViz du marché

    • Travaux pratiques : Implémentation & utilisation d’un outil de Data Visualisation pour concevoir des analyses dynamiques

  • Pour aller plus loin

    • Bonnes pratiques

Instructeur

Avatar de l’utilisateur

bprigent

0.0
0 commentaire
0 Students
491 Courses
Main Content