Description
Objectif de formation : Appréhender les enjeux et intérêts du Big Data, puis découvrir les différents outils.
Objectifs pédagogiques
- Maîtriser les notions clés et les intérêts du Big Data vis-à-vis des enjeux métiers
- Appréhender l'environnement technologique nécessaire pour créer et déployer un projet Big Data
- Détenir les connaissances techniques pour manipuler et administrer des flux de données complexes, non structurés et massifs
- Mettre en oeuvre des modèles d'analyses statistiques pour répondre aux besoins métiers
- Manipuler un outil de data visualisation pour concevoir des analyses dynamiques
Public concerné
Dataminers
Chargés d'études statistiques
Développeurs
Chefs de projet
Consultants en informatique décisionnelle
Prérequis
Connaissances de base des modèles relationnels, des statistiques et des langages de programmation
Connaissances de base des concepts de la Business Intelligence
Déroulé du programme
1
Introduction : notions & enjeux du Big Data
- Histoire et terminologie du Big Data
- Le Big Data aujourd'hui : chiffres clés Monde et France
- Tour d'horizon des enjeux du Big Data
- Travaux pratiques : analyse d'une architecture Big Data
2
Technologies du Big Data
- Étude de l'architecture et des composants d'Hadoop
- Présentation des modes de stockage
- Principes de fonctionnement de MapReduce, Spark, Storm...
- Tour d'horizon des différentes distributions du marché
- Installation d'une plateforme Hadoop
- Datascientist : missions et défis
- Introduction aux technologies spécifiques pour la data visualisation
- Travaux pratiques : Implémentation d'une plateforme Big Data Hadoop
3
Traitement des données structurées & non structurées
- Fonctionnement de Hadoop Distributed File System
- Importation des données externes vers HDFS
- Déployer des requêtes SQL avec HIVE
- Utilisation de PIG pour le traitement de la donnée
- Principe des ETL
- Utilisation de streaming de données massive
- Travaux pratiques : Mise en oeuvre de flux de données massives
4
Technique & méthodes Big Data analytics
- Introduction au Machine Learning & à l'IA
- Régression, Classification & Clustering
- Travail en amont : préparation des données
- Génération des modèles en R ou Python
- Ensemble Learning
- Présentation des outils du marché
- Exercice : Mise en oeuvre d'analyses
5
Data visualisation & cas d'usage concrets
- Définition du besoin de la data visualisation
- Analyse & visualisation des données
- Types de données & DataViz
- Présentation des outils de DataViz du marché
- Travaux pratiques : Implémentation & utilisation d'un outil de Data Visualisation pour concevoir des analyses dynamiques
6
Pour aller plus loin
- Bonnes pratiques
Informations
Durée
5 jour(s)
35h
Tarif
3250 € HT
HT
Formations similaires
IA & Data
Migration vers le Cloud
2 jour(s)
Sur demande
IA & Data
Agents IA — Concevoir des systèmes autonomes avec LangChain et LangGraph - Avancé
3 jour(s)
Sur demande
IA & Data
AI Act européen — Comprendre vos obligations et vous mettre en conformité - Niveau débutant
1 jour(s)
Sur demande
IA & Data
Analyse des données avec Microsoft Power BI (4-167)
3 jour(s)
2200 € HT