Aperçu du cours
Objectifs de formation : à l’issue de la formation, le stagiaire sera capable de maîtriser le framework Spark pour traiter des données hétérogènes et optimiser les calculs.
Prérequis
- Avoir des bonnes connaissances de Java ou Python
- Avoir des notions de calculs statistiques
Fonctionnalités
- Maîtriser les concepts fondamentaux de Spark
- Savoir intégrer Spark dans un environnement Hadoop
- Développer des applications d’analyse en temps réel avec Spark Streaming
- Faire de la programmation parallèle avec Spark sur un cluster
- Manipuler des données avec Spark SQL
- Avoir une première approche du Machine Learning
Public ciblé
- Chefs de projet
- Data Scientists
- Développeurs
- Architectes
Détails
- 14 Sections
- 76 Lessons
- 21
Expand all sectionsCollapse all sections
- Introduction d'Apache Spark5
- Introduction d'Apache Spark5
- Programmation avec les Resilient Distributed Dataset4
- Programmation avec les Resilient Distributed Dataset4
- Données structurées avec Spark SQL6
- Données structurées avec Spark SQL6
- Spark sur un cluster6
- Spark sur un cluster6
- Spark Streaming : analyse en temps réel6
- Spark Streaming : analyse en temps réel6
- GraphX : Manipulation de graphes6
- GraphX : Manipulation de graphes6
- Machine learning & Spark5
- Machine learning & Spark5