Support & Downloads

Quisque actraqum nunc no dolor sit ametaugue dolor. Lorem ipsum dolor sit amet, consyect etur adipiscing elit.

s f

Contact Info
198 West 21th Street, Suite 721
New York, NY 10010
youremail@yourdomain.com
+88 (0) 101 0000 000
Follow Us

Spark & Storm - Traitement de données Big Data

réf : BDT-SST

Objectif de formation : Comprendre le fonctionnement et les forces des outils Storm et Spark.

Objectifs pédagogiques

  • Maîtriser les concepts de base du développement d’applications Big Data en temps réel
  • Appréhender Spark et Storm
  • Implémenter des systèmes de calcul distribué temps réel de Storm & de Spark
  • Gérer des quantités importante de données en temps réel

Pré-requis

Connaissances solides en développement logiciel

Public concerné

Concepteurs, Développeurs, Architectes…

Programme

  • Traitements temps réel
  • Architectures LAMBDA
  • Architectures KAPPA
  • Architectures SMACK

Travaux pratiques :

Étude de l’implémentation d’une architecture KAPPA pour Spark et Strom

  • Présentation de Kafka Producers, Brokers, Consumers
  • Fichiers journaux
  • Schémas Avro
  • Utilisation de ZooKeeper

Travaux pratiques

Étude de la configuration de Kafka dans l’architecture KAPPA

  • Détermination de l’environnement de développement
  • Construction de projets sur Storm
  • Présentation des composants Storm
  • Présentation des flux Storm
  • Modèle de données
  • Rôles des Nimbus et ZooKeeper

Travaux pratiques

Implémentation de l’architecture KAPPA pour Storm

  • Programmation de services avec Clojure, Java, Python
  • Cycle de vie d’un message
  • API Storm : fiabilité
  • Déploiement de la fiabilité pour une application utilisant le Big Data

Travaux pratiques :

Implémentation d’un projet de traitement des réseaux sociaux en temps réel dans l’architecture KAPPA

  • Versionning de Spark (Scala, Python, R et Java)
  • Comparatif avec Storm
  • Tour d’horizon des modules de Spark
  • Présentation des différents types d’architecture : Standalone, Apache Mesos ou Hadoop YARN

Travaux pratiques

Etude de l’implémentation de l’architecture SMACK pour Spark

  • Présentation des RDD
  • Création, manipulation et réutilisation des RDD
  • Accumulateurs & variables broadcastées
  • Principe de fonctionnement
  • Présentation des différents types de sources
  • Comparatif avec Apache Storm

Travaux pratiques :

Implémentation d’un projet de traitement des réseaux sociaux en temps réel

  • Tour d’horizon des outils de streaming de l’écosystème (Storm, Spark Streaming, Flink, Samza)
  • Focus sur l’architecture Samza

Travaux pratiques :

Étude de l’implémentation de l’architecture KAPPA avec Samza

Équipe pédagogique

Professionnel expert technique et pédagogique

Moyens pédagogiques et techniques

  • Espace intranet de formation.
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Dispositif de suivi

  • Émargement numérique.
  • Mises en situation.
  • Formulaires d’évaluation de la formation.
  • Certificat de réalisation de l’action de formation.

Vous avez une question ?