Description
Cette formation vise à fournir aux décideurs et ingénieurs un aperçu complet des enjeux associés au Big Data, en mettant l'accent sur la valorisation des données, le potentiel économique et les architectures technologiques sous-jacentes. Les participants auront également l'occasion de se familiariser avec des exemples concrets d'analyses et de visualisations de données.
Objectifs pédagogiques
- Comprendre les enjeux majeurs liés au Big Data.
- Apprécier la valeur économique des données dans un contexte professionnel.
- Identifier les architectures et technologies du Big Data.
- Explorer des exemples concrets d'analyses et de visualisations de données.
- Appliquer les concepts pratiques lors des travaux pratiques.
Public concerné
Cette formation s'adresse aux décideurs, responsables stratégiques et ingénieurs impliqués dans la gestion et l'exploitation des données au sein de leur organisation.
Prérequis
Les participants doivent avoir des connaissances de base en systèmes de gestion de bases de données et des notions de méthodes d'apprentissage automatique.
Déroulé du programme
1
Introduction au Big Data et ses enjeux (1h)
1h
- Définition du Big Data : les 5 V
- Panorama des données dans les environnements publics et militaires
- Données structurées vs non structurées
- Travaux pratiques : Cartographie des sources de données disponibles dans son organisation
2
Valorisation de la donnée et potentiel économique (2h)
2h
- Cycle de vie de la donnée : collecte, traitement, valorisation
- Exemples d’usages à forte valeur ajoutée (maintenance prédictive, renseignement, pilotage)
- Enjeux éthiques, juridiques et sécuritaires
- Travaux pratiques : Identification de cas d’usage internes et analyse de leur ROI potentiel
3
Architectures et technologies du Big Data (2h)
2h
- Architecture distribuée : HDFS, Spark, Hadoop
- Environnements de traitement en flux vs batch
- Stockage, orchestration, gestion des métadonnées
- Travaux pratiques : Schématisation d’une architecture Big Data adaptée à un cas concret (ex : supervision opérationnelle)
4
Exemples d’analyses et de visualisations de données (2h)
2h
- Principes d’analyse exploratoire (EDA)
- Visualisation de données : bonnes pratiques
- Outils : Power BI, matplotlib, seaborn
- Travaux pratiques : Représentation graphique de données opérationnelles simulées (Python ou Excel)
5
Exploration de données avec Python et Pandas (3h30)
3h
- Manipulation de jeux de données avec Pandas
- Nettoyage et transformation des données
- Détection de valeurs aberrantes, corrélations simples
- Travaux pratiques (2h30) : Analyse complète d’un jeu de données simulé (fichier CSV)
6
Utilisation de technologies Big Data (3h30)
3h
- Introduction à Apache Spark : principes, DataFrame API
- Démonstration ou manipulation sur notebooks Spark
- Scénarios d’intégration avec des bases de données externes (NoSQL, SQL)
- Travaux pratiques : Traitement distribué d’un jeu de données volumineux avec PySpark ou équivalent. Mise en situation : analyse comparative de performances (traitement local vs distribué)
Informations
Durée
2 jour(s)
14h
Tarif
1500 € HT
HT
Formations similaires
IA & Data
Migration vers le Cloud
2 jour(s)
Sur demande
IA & Data
Agents IA — Concevoir des systèmes autonomes avec LangChain et LangGraph - Avancé
3 jour(s)
Sur demande
IA & Data
AI Act européen — Comprendre vos obligations et vous mettre en conformité - Niveau débutant
1 jour(s)
Sur demande
IA & Data
Analyse des données avec Microsoft Power BI (4-167)
3 jour(s)
2200 € HT