Détails
- 6 Sections
- 24 Lessons
- 2 Days
Expand all sectionsCollapse all sections
- Introduction au Big Data et ses enjeux (1h)4
- Utilisation de technologies Big Data (3h30)4
- 2.1Introduction à Apache Spark : principes, DataFrame API
- 2.2Démonstration ou manipulation sur notebooks Spark
- 2.3Scénarios d’intégration avec des bases de données externes (NoSQL, SQL)
- 2.4Travaux pratiques : Traitement distribué d’un jeu de données volumineux avec PySpark ou équivalent. Mise en situation : analyse comparative de performances (traitement local vs distribué)
- Exploration de données avec Python et Pandas (3h30)4
- Exemples d’analyses et de visualisations de données (2h)4
- Architectures et technologies du Big Data (2h)4
- Valorisation de la donnée et potentiel économique (2h)4