Aperçu du cours
Objectif de formation : Appréhender les enjeux et intérêts du Big Data, puis découvrir les différents outils.
Prérequis
- Connaissances de base des modèles relationnels, des statistiques et des langages de programmation
- Connaissances de base des concepts de la Business Intelligence
Objectifs pédagogiques
- Maîtriser les notions clés et les intérêts du Big Data vis-à-vis des enjeux métiers
- Appréhender l'environnement technologique nécessaire pour créer et déployer un projet Big Data
- Détenir les connaissances techniques pour manipuler et administrer des flux de données complexes, non structurés et massifs
- Mettre en oeuvre des modèles d'analyses statistiques pour répondre aux besoins métiers
- Manipuler un outil de data visualisation pour concevoir des analyses dynamiques
Public ciblé
- Dataminers
- Chargés d'études statistiques
- Développeurs
- Chefs de projet
- Consultants en informatique décisionnelle
Programme de formation
-
Introduction : notions & enjeux du Big Data
-
Histoire et terminologie du Big Data
-
Le Big Data aujourd’hui : chiffres clés Monde et France
-
Tour d’horizon des enjeux du Big Data
-
Travaux pratiques : analyse d’une architecture Big Data
-
-
Technologies du Big Data
-
Étude de l’architecture et des composants d’Hadoop
-
Présentation des modes de stockage
-
Principes de fonctionnement de MapReduce, Spark, Storm…
-
Tour d’horizon des différentes distributions du marché
-
Installation d’une plateforme Hadoop
-
Datascientist : missions et défis
-
Introduction aux technologies spécifiques pour la data visualisation
-
Travaux pratiques : Implémentation d’une plateforme Big Data Hadoop
-
-
Traitement des données structurées & non structurées
-
Fonctionnement de Hadoop Distributed File System
-
Importation des données externes vers HDFS
-
Déployer des requêtes SQL avec HIVE
-
Utilisation de PIG pour le traitement de la donnée
-
Principe des ETL
-
Utilisation de streaming de données massive
-
Travaux pratiques : Mise en oeuvre de flux de données massives
-
-
Technique & méthodes Big Data analytics
-
Introduction au Machine Learning & à l’IA
-
Régression, Classification & Clustering
-
Travail en amont : préparation des données
-
Génération des modèles en R ou Python
-
Ensemble Learning
-
Présentation des outils du marché
-
Exercice : Mise en oeuvre d’analyses
-
-
Data visualisation & cas d'usage concrets
-
Définition du besoin de la data visualisation
-
Analyse & visualisation des données
-
Types de données & DataViz
-
Présentation des outils de DataViz du marché
-
Travaux pratiques : Implémentation & utilisation d’un outil de Data Visualisation pour concevoir des analyses dynamiques
-
-
Pour aller plus loin
-
Bonnes pratiques
-