Détails
- 6 Sections
- 24 Lessons
- 2 Days
Expand all sectionsCollapse all sections
- Introduction au Big Data et ses enjeux (1h)4
- 1.1Définition du Big Data : les 5 V
- 1.2Panorama des données dans les environnements publics et militaires
- 1.3Données structurées vs non structurées
- 1.4Travaux pratiques : Cartographie des sources de données disponibles dans son organisation
- Utilisation de technologies Big Data (3h30)4
- 2.1Introduction à Apache Spark : principes, DataFrame API
- 2.2Démonstration ou manipulation sur notebooks Spark
- 2.3Scénarios d’intégration avec des bases de données externes (NoSQL, SQL)
- 2.4Travaux pratiques : Traitement distribué d’un jeu de données volumineux avec PySpark ou équivalent. Mise en situation : analyse comparative de performances (traitement local vs distribué)
- Exploration de données avec Python et Pandas (3h30)4
- 3.1Manipulation de jeux de données avec Pandas
- 3.2Nettoyage et transformation des données
- 3.3Détection de valeurs aberrantes, corrélations simples
- 3.4Travaux pratiques (2h30) : Analyse complète d’un jeu de données simulé (fichier CSV)
- Exemples d’analyses et de visualisations de données (2h)4
- 4.1Principes d’analyse exploratoire (EDA)
- 4.2Visualisation de données : bonnes pratiques
- 4.3Outils : Power BI, matplotlib, seaborn
- 4.4Travaux pratiques : Représentation graphique de données opérationnelles simulées (Python ou Excel)
- Architectures et technologies du Big Data (2h)4
- 5.1Architecture distribuée : HDFS, Spark, Hadoop
- 5.2Environnements de traitement en flux vs batch
- 5.3Stockage, orchestration, gestion des métadonnées
- 5.4Travaux pratiques : Schématisation d’une architecture Big Data adaptée à un cas concret (ex : supervision opérationnelle)
- Valorisation de la donnée et potentiel économique (2h)4
- 6.1Cycle de vie de la donnée : collecte, traitement, valorisation
- 6.2Exemples d’usages à forte valeur ajoutée (maintenance prédictive, renseignement, pilotage)
- 6.3Enjeux éthiques, juridiques et sécuritaires
- 6.4Travaux pratiques : Identification de cas d’usage internes et analyse de leur ROI potentiel