Beschrijving
Doel van de training: De training is bedoeld om deelnemers praktische vaardigheden bij te brengen voor het verwerken, analyseren en verwerken van grote hoeveelheden gegevens met behulp van SQL-, Hive- en Spark DataFrames. De leerling zal de kennis hebben om deze technologieën te integreren om gegevensextractie, transformatie en laden (ETL) in Big Data-omgevingen te optimaliseren.
Leerdoelen
- Comprendre les rôles de SQL, Hive, et Spark dans l'écosystème Big Data.
- Être capable de réaliser des manipulations de données complexes et des analyses avec Hive.
- Maîtriser l'utilisation des Spark DataFrames pour le traitement de données à grande échelle.
- Intégrer SQL, Hive et Spark pour optimiser les processus ETL dans des projets Big Data.
Doelgroep
Développeurs
Ingénieurs Big Data
Data analysts
Vereisten
Connaissances de base en programmation SQL.
Familiarité avec les concepts de base du traitement de données et des systèmes de gestion de bases de données.
Une expérience préalable avec des outils de traitement de données comme Hive ou Spark est un plus, mais pas obligatoire.
Programmaoverzicht
Informations
Duur
2 jours
14 heures
Tarif
1500 €
HT