Formation en Cloud: Hadoop  Cloudera - Configuration des systèmes distribués (4-016) - Ascent Formation
Retour aux formations
Cloud

Hadoop Cloudera - Configuration des systèmes distribués (4-016)

4 jour(s)24h

Description

Objectif général de la formation : Permettre aux participants de maîtriser les concepts, l'installation, la configuration et l'optimisation d'une plateforme Hadoop basée sur Cloudera pour gérer des systèmes distribués adaptés au Big Data. Modalité : Toutes les modalités (présentiel, classe virtuelle et hybride) sont possibles Lieu possible de réalisation : Locaux du bénéficiaire ou locaux d’Ascent Formation, en France métropolitaine et dans les DROM-COM Nombre maximal de participants : 20 Niveau SAME visé : Application (A) Compétences visées : Maîtriser les bases du fonctionnement des systèmes distribués avec Hadoop. Installer, configurer et administrer une plateforme Hadoop avec Cloudera. Optimiser les performances et résoudre les problèmes liés à l'infrastructure. Comprendre les enjeux stratégiques des systèmes distribués pour la gestion de grandes quantités de données.

Objectifs pédagogiques

  • Découvrir les concepts et les enjeux liés à Hadoop.
  • Comprendre le fonctionnement de la plateforme et de ses composants.
  • Installer la plateforme et la gérer.
  • Optimiser la plateforme.

Public concerné

Administrateurs systèmes et réseaux souhaitant intégrer Hadoop dans leur infrastructure.
Ingénieurs et techniciens responsables des systèmes distribués et du stockage de données.
Toute personne souhaitant acquérir des compétences en gestion de clusters Hadoop.

Prérequis

Connaissances générales des systèmes d’exploitation Linux.
Notions de bases sur les systèmes distribués et les bases de données.
Expérience en administration de systèmes informatiques (souhaitée).

Déroulé du programme

1

Jour 1 : Introduction et concepts fondamentaux (6 heures)

6h
  • Introduction à Hadoop et ses enjeux (2 heures)
2

Origines et concepts de base du Big Data et des systèmes distribués.

3

Présentation des composants Hadoop : HDFS, MapReduce, YARN.

4

Travaux pratiques : Explorer l’architecture d’un cluster Hadoop.

  • Environnement Cloudera (2 heures)
5

Présentation de la distribution Cloudera et de ses avantages.

6

Comparaison avec d’autres distributions (Hortonworks, Apache).

7

Travaux pratiques : Configurer l’accès à l’interface Cloudera Manager.

  • Concepts de stockage distribué (2 heures)
8

Fonctionnement de HDFS et gestion des données.

9

Travaux pratiques : Simulation d’un stockage distribué sur un environnement test.

10

Jour 2 : Installation et configuration de Hadoop (6 heures)

6h
  • Préparation de l’environnement (3 heures)
11

Installation des prérequis système et configuration de l’infrastructure.

12

Installation de Cloudera Manager et des composants Hadoop.

13

Travaux pratiques : Installer Hadoop sur un environnement virtuel.

  • Configuration du cluster Hadoop (3 heures)
14

Configuration des services HDFS, YARN, et MapReduce.

15

Gestion des utilisateurs et des permissions.

16

Travaux pratiques : Configurer un cluster Hadoop simple avec plusieurs nœuds.

17

Jour 3 : Administration et gestion des clusters (6 heures)

6h
  • Administration des services Hadoop (3 heures)
18

Surveiller les performances des clusters.

19

Gérer les logs et résoudre les problèmes courants.

20

Travaux pratiques : Surveiller un cluster et diagnostiquer des problèmes.

  • Gestion des données dans Hadoop (3 heures)
21

Ingestion des données avec Sqoop et Flume.

22

Traitement des données avec Hive et Pig.

23

Travaux pratiques : Importer des données avec Sqoop et les traiter avec Hive.

24

Jour 4 : Optimisation et bonnes pratiques (6 heures)

6h
  • Optimisation des performances (3 heures)
25

Optimisation des paramètres des services Hadoop.

26

Gestion de la scalabilité et du stockage.

27

Travaux pratiques : Optimiser un cluster pour un traitement intensif.

  • Bonnes pratiques et sécurité (3 heures)
28

Implémentation de la sécurité avec Kerberos et chiffrement des données.

29

Travaux pratiques : Configurer un cluster sécurisé avec Kerberos.

Informations

Durée

4 jour(s)

24h

Tarif

2850 € HT

HT

Prochaines sessions