Aperçu du cours
Objectifs de formation : à l’issue de la formation, le stagiaire sera capable de développer des applications compatibles avec la plateforme Hadoop d’Apache pour traiter des données Big Data.
Prérequis
- Avoir la connaissance d'un langage de programmation objet comme Java et du scripting
Fonctionnalités
- Comprendre l’écosystème Hadoop Cloudera/Hortonworks
- Présenter les principes du Framework Hadoop
- Mettre en œuvre des tâches Hadoop pour extraire des éléments pertinents d'ensembles de données volumineux et variés
- Développer des algorithmes parallèles efficaces avec MapReduce
- Charger des données non structurées des systèmes HDFS et HBase
Public ciblé
- Développeurs
- Chefs de projets
- Data-scientists
- Architectes
Détails
- 14 Sections
- 74 Lessons
- 21 heures
Expand all sectionsCollapse all sections
- Présentation d'Hadoop4
- Présentation d'Hadoop4
- MapReduce6
- MapReduce6
- Programmation6
- Programmation6
- Outils complémentaires7
- 7.1Mise en place du cache distribué
- 7.2Utilisation du langage Python pour la création d’un Job MapReduce
- 7.3Répartition sur la ferme
- 7.4Forces & faiblesses
- 7.5Liaisons avec des systèmes externes
- 7.6Présentation du pont HadoopR
- 7.7Travaux pratiques : Création d’un Job MapReduce sous Python & suivi en streaming
- Outils complémentaires7
- 8.1Mise en place du cache distribué
- 8.2Utilisation du langage Python pour la création d’un Job MapReduce
- 8.3Répartition sur la ferme
- 8.4Forces & faiblesses
- 8.5Liaisons avec des systèmes externes
- 8.6Présentation du pont HadoopR
- 8.7Travaux pratiques : Création d’un Job MapReduce sous Python & suivi en streaming
- Création de MapReduce avec Apache Pig8
- Création de MapReduce avec Apache Pig8
- Apache Hive4
- Apache Hive4
- Sécurité2
- Sécurité2