réf : BDT-SPA
Objectif de formation : Dans ce cours, vous apprendrez à utiliser Spark SQL, Spark Streaming et Spark MLlib pour développer des applications big data. À la fin de cette formation, vous serez en mesure de développer des applications big data à la fois efficaces et évolutives. En outre, vous serez en mesure de construire des pipelines de données optimisés pour le traitement de grands ensembles de données. Vous comprendrez les principes fondamentaux de l’interrogation et de l’analyse des données volumineuses. Enfin, vous comprendrez les techniques avancées et les meilleures pratiques utilisées dans le développement du big data.
Bonnes connaissances du langage Java
Développeurs, architectes, data scientists…
Travaux pratiques
Installation et paramétrage de Spark. Première utilisation basique
Travaux pratiques
Utilisation de divers datasets avec des RDD, usage de l’API de Spark
Travaux pratiques
Utilisation de Datasets via des requêtes SQL, création d’une connexion à une base externe.
Travaux pratiques
Création et mise en oeuvre d’un cluster Spark
Travaux pratiques
Consommation de logs avec Spark Streaming
Travaux pratiques
Manipulation de l’API GraphX à travers différents exemples
Travaux pratiques
Utilisation de SparkML & MLlib
Professionnel expert dans le Big Data