IA & Data

BigData: SQL-integratie, Hive, SparkDataFrames

2 jours • 14 heures

Beschrijving

Doel van de training: De training is bedoeld om deelnemers praktische vaardigheden bij te brengen voor het verwerken, analyseren en verwerken van grote hoeveelheden gegevens met behulp van SQL-, Hive- en Spark DataFrames. De leerling zal de kennis hebben om deze technologieën te integreren om gegevensextractie, transformatie en laden (ETL) in Big Data-omgevingen te optimaliseren.

Leerdoelen

Comprendre les rôles de SQL, Hive, et Spark dans l'écosystème Big Data.
Être capable de réaliser des manipulations de données complexes et des analyses avec Hive.
Maîtriser l'utilisation des Spark DataFrames pour le traitement de données à grande échelle.
Intégrer SQL, Hive et Spark pour optimiser les processus ETL dans des projets Big Data.