Spark – Développer des applications pour le Big Data

0 Enrolled
21
  • 21
  • 76
  • 0
2,100.00€

Aperçu du cours

Objectifs de formation : à l’issue de la formation, le stagiaire sera capable de maîtriser le framework Spark pour traiter des données hétérogènes et optimiser les calculs.

Prérequis

  • Avoir des bonnes connaissances de Java ou Python
  • Avoir des notions de calculs statistiques

Fonctionnalités

  • Maîtriser les concepts fondamentaux de Spark
  • Savoir intégrer Spark dans un environnement Hadoop
  • Développer des applications d’analyse en temps réel avec Spark Streaming
  • Faire de la programmation parallèle avec Spark sur un cluster
  • Manipuler des données avec Spark SQL
  • Avoir une première approche du Machine Learning

Public ciblé

  • Chefs de projet
  • Data Scientists
  • Développeurs
  • Architectes

Détails

  • 14 Sections
  • 76 Lessons
  • 21
Expand all sectionsCollapse all sections
  • 5
    • 1.1
      Présentation de l’histoire de Spark
    • 1.2
      Les versions de Spark
    • 1.3
      Spark vs Apache Hadoop
    • 1.4
      Les modules de Spark
    • 1.5
      Travaux pratiques : Installation et paramétrage de Spark. Première utilisation basique
  • 5
    • 2.1
      Présentation de l’histoire de Spark
    • 2.2
      Les versions de Spark
    • 2.3
      Spark vs Apache Hadoop
    • 2.4
      Les modules de Spark
    • 2.5
      Travaux pratiques : Installation et paramétrage de Spark. Première utilisation basique
  • 4
    • 3.1
      Définition des RDD
    • 3.2
      Création, manipulation et réutilisation des RDD
    • 3.3
      Utiliser des partitions
    • 3.4
      Travaux pratiques : Utilisation de divers datasets avec des RDD, usage de l’API de Spark
  • 4
    • 4.1
      Définition des RDD
    • 4.2
      Création, manipulation et réutilisation des RDD
    • 4.3
      Utiliser des partitions
    • 4.4
      Travaux pratiques : Utilisation de divers datasets avec des RDD, usage de l’API de Spark
  • 6
    • 5.1
      SQL, Dataframes & Datasets
    • 5.2
      Présentation des types de sources de données
    • 5.3
      Interopérabilité avec les RDD
    • 5.4
      Performance de Spark SQL
    • 5.5
      JDBC/ODBC server & Spark SQL CLI
    • 5.6
      Travaux pratiques : Utilisation de Datasets via des requêtes SQL, création d’une connexion à une base externe.
  • 6
    • 6.1
      SQL, Dataframes & Datasets
    • 6.2
      Présentation des types de sources de données
    • 6.3
      Interopérabilité avec les RDD
    • 6.4
      Performance de Spark SQL
    • 6.5
      JDBC/ODBC server & Spark SQL CLI
    • 6.6
      Travaux pratiques : Utilisation de Datasets via des requêtes SQL, création d’une connexion à une base externe.
  • 6
    • 7.1
      Présentation des types d’architectures
    • 7.2
      Paramétrage d’un cluster en Standalone
    • 7.3
      Package d’une application et ses dépendances
    • 7.4
      Déploiement d’applications avec Spark-submit
    • 7.5
      Dimensionnement d’un cluster
    • 7.6
      Travaux pratiques : Création et mise en oeuvre d’un cluster Spark
  • 6
    • 8.1
      Présentation des types d’architectures
    • 8.2
      Paramétrage d’un cluster en Standalone
    • 8.3
      Package d’une application et ses dépendances
    • 8.4
      Déploiement d’applications avec Spark-submit
    • 8.5
      Dimensionnement d’un cluster
    • 8.6
      Travaux pratiques : Création et mise en oeuvre d’un cluster Spark
  • 6
    • 9.1
      Principe de fonctionnement
    • 9.2
      Définition ds DStreams
    • 9.3
      Présentation des types de sources
    • 9.4
      Manipulation de l’API
    • 9.5
      Comparaison Spark Streaming & Apache Storm
    • 9.6
      Travaux pratiques : Consommation de logs avec Spark Streaming
  • 6
    • 10.1
      Principe de fonctionnement
    • 10.2
      Définition ds DStreams
    • 10.3
      Présentation des types de sources
    • 10.4
      Manipulation de l’API
    • 10.5
      Comparaison Spark Streaming & Apache Storm
    • 10.6
      Travaux pratiques : Consommation de logs avec Spark Streaming
  • 6
    • 11.1
      Présentation de l’outil
    • 11.2
      Les différentes opérations
    • 11.3
      Création de graphes
    • 11.4
      Vertex & Edge RDD
    • 11.5
      Présentation des algorithmes
    • 11.6
      Travaux pratiques : Manipulation de l’API GraphX à travers différents exemples
  • 6
    • 12.1
      Présentation de l’outil
    • 12.2
      Les différentes opérations
    • 12.3
      Création de graphes
    • 12.4
      Vertex & Edge RDD
    • 12.5
      Présentation des algorithmes
    • 12.6
      Travaux pratiques : Manipulation de l’API GraphX à travers différents exemples
  • 5
    • 13.1
      Introduction au Machine Learning
    • 13.2
      Les classes d’algorithmes
    • 13.3
      Sprak ML & MLlib
    • 13.4
      Implémentations des algorithmes dans MLlib
    • 13.5
      Travaux pratiques : Utilisation de SparkML & MLlib
  • 5
    • 14.1
      Introduction au Machine Learning
    • 14.2
      Les classes d’algorithmes
    • 14.3
      Sprak ML & MLlib
    • 14.4
      Implémentations des algorithmes dans MLlib
    • 14.5
      Travaux pratiques : Utilisation de SparkML & MLlib

Instructeur

Avatar de l’utilisateur

nduval

0.0
0 commentaire
1 Student
37 Courses