Aperçu du cours
Cette formation vise à fournir aux décideurs et ingénieurs un aperçu complet des enjeux associés au Big Data, en mettant l’accent sur la valorisation des données, le potentiel économique et les architectures technologiques sous-jacentes. Les participants auront également l’occasion de se familiariser avec des exemples concrets d’analyses et de visualisations de données.
Prérequis
- Les participants doivent avoir des connaissances de base en systèmes de gestion de bases de données et des notions de méthodes d'apprentissage automatique.
Fonctionnalités
- Comprendre les enjeux majeurs liés au Big Data.
- Apprécier la valeur économique des données dans un contexte professionnel.
- Identifier les architectures et technologies du Big Data.
- Explorer des exemples concrets d'analyses et de visualisations de données.
- Appliquer les concepts pratiques lors des travaux pratiques.
Public ciblé
- Cette formation s'adresse aux décideurs, responsables stratégiques et ingénieurs impliqués dans la gestion et l'exploitation des données au sein de leur organisation.
Détails
- 6 Sections
- 24 Lessons
- 2 Days
Expand all sectionsCollapse all sections
- Introduction au Big Data et ses enjeux (1h)4
- Utilisation de technologies Big Data (3h30)4
- 2.1Introduction à Apache Spark : principes, DataFrame API
- 2.2Démonstration ou manipulation sur notebooks Spark
- 2.3Scénarios d’intégration avec des bases de données externes (NoSQL, SQL)
- 2.4Travaux pratiques : Traitement distribué d’un jeu de données volumineux avec PySpark ou équivalent. Mise en situation : analyse comparative de performances (traitement local vs distribué)
- Exploration de données avec Python et Pandas (3h30)4
- Exemples d’analyses et de visualisations de données (2h)4
- Architectures et technologies du Big Data (2h)4
- Valorisation de la donnée et potentiel économique (2h)4