Aperçu du cours
Objectif de formation : Appréhender les enjeux et intérêts du Big Data, puis découvrir les différents outils.
Programme d'études
Introduction : notions & enjeux du Big Data
Histoire et terminologie du Big Data
Le Big Data aujourd’hui : chiffres clés Monde et France
Tour d’horizon des enjeux du Big Data
Travaux pratiques : analyse d’une architecture Big Data
Technologies du Big Data
Étude de l’architecture et des composants d’Hadoop
Présentation des modes de stockage
Principes de fonctionnement de MapReduce, Spark, Storm…
Tour d’horizon des différentes distributions du marché
Installation d’une plateforme Hadoop
Datascientist : missions et défis
Introduction aux technologies spécifiques pour la data visualisation
Travaux pratiques : Implémentation d’une plateforme Big Data Hadoop
Traitement des données structurées & non structurées
Fonctionnement de Hadoop Distributed File System
Importation des données externes vers HDFS
Déployer des requêtes SQL avec HIVE
Utilisation de PIG pour le traitement de la donnée
Principe des ETL
Utilisation de streaming de données massive
Travaux pratiques : Mise en oeuvre de flux de données massives
Technique & méthodes Big Data analytics
Introduction au Machine Learning & à l’IA
Régression, Classification & Clustering
Travail en amont : préparation des données
Génération des modèles en R ou Python
Ensemble Learning
Présentation des outils du marché
Exercice : Mise en oeuvre d’analyses
Data visualisation & cas d'usage concrets
Définition du besoin de la data visualisation
Analyse & visualisation des données
Types de données & DataViz
Présentation des outils de DataViz du marché
Travaux pratiques : Implémentation & utilisation d’un outil de Data Visualisation pour concevoir des analyses dynamiques
Pour aller plus loin
Bonnes pratiques