Formation en IA & Data: Elasticsearch - Indexation - Ascent Formation
Retour aux formations
IA & Data

Elasticsearch - Indexation

2 jour(s)14h

Description

Objectifs de formation : à l’issue de la formation, le stagiaire sera capable de mettre en œuvre une solution de recherche performante de données volumineuses avec ElasticSearch.

Objectifs pédagogiques

  • Situer Elasticsearch dans un écosystème Big Data
  • Identifier les enjeux et les cas d'utilisation d'un moteur de recherche
  • Appréhender le fonctionnement d'ElasticSearch
  • Savoir installer et configurer ElasticSearch
  • Indexer des volumes importants de données
  • Comprendre comment administrer le système et le surveiller afin de garantir sa disponibilité

Public concerné

Administrateur système
Architectes
Développeurs
Data Analysts
Data Engineers

Prérequis

Disposer de solides bases en administration système Unix/Linux

Déroulé du programme

1

Présentation des moteurs de recherche

  • Définitions & tour d'horizon des outils Open Source
  • Implémentation d'un moteur de recherche au sein d'une App
  • Enjeux & clés de succès
  • Présentation d'Elasticsearch & historique des versions
2

Le projet Elasticsearch

  • Historique du projet
  • Apache Lucene
  • Comparatif Elascticsearch / Lucene
3

Premiers pas sur Elasticsearch

  • Fonctionnement en Cluster
  • Installation & paramétrage
  • Définitions : Node, Index & type
  • Partitionnement de données
  • API Rest
4

Observabilité

  • Monitoring
  • Logs
  • Metrics
  • Traces API
  • Envoyer des données depuis un serveur Elastic
  • Données métriques d'expédition // Données de journal d'expédition
  • APM
  • Applications d'observabilité
5

Indexation

  • Création d'index et des documents liés
  • API Rest : suppression & indexation
  • Indexation en masse
  • Version
  • Pondération
  • Pour aller plus loin : tour d'horizon des fonctionnalités avancées
6

Mapping

  • Qu'est ce que le mapping ?
  • Intérêt du mapping
  • Type de champs
  • Focus sur les champs prédéfinis
  • Méta données d'un Index
7

Analyse & extraction de texte

  • Notions fondamentales de l'extraction et de l'analyse de texte : analysers, char filters, tokenizers, token filters
  • Cas d'usage
  • Paramétrage & manipulation des analyzers prédéfinis ou customisés
  • Analyse de texte multilingue
  • Suppression de mots
  • Extraction d'adresses email & d'URLs
  • Suppression de balises HTML
  • Correction orthographique
  • Indexation de fichiers binaires
8

Recherche de documents

  • Recherche par l'API Rest
  • Gestion des résultats
  • Types de requêtes
  • Requêtes & filtres
  • Types de filtres
  • Combinaison de filtres
  • Pertinence & score
  • Suggestions
  • Autocomplétion
  • Highlighting
  • Recherche Objets / Nested / Parent-Enfant
  • More Like This
  • Recherche géospatiale
9

Elasticsearch & API Java

  • Types de clients disponibles
  • Intégration Java / Elasticsearch
  • API Java
  • Indexation & recherche de documents
  • Gestion des index
  • Gestion des mappings
10

Cloud & clusterisation

  • Fonctionnement d'un cluster Elasticsearch
  • Split brains
  • Paramétrage du cluster
  • Scalabilité & volumétrie de données
  • Sauvegarde & restauration du cluster
  • Supervision du cluster
11

Pour aller plus loin

  • Plugins Elasticsearch
  • River
  • Scripting
  • Pré-chauffage du cluster
  • Percolation
  • Maintenance des nodes
  • Répartition des indexes sur différents nodes
  • Requêtes et statistiques

Informations

Durée

2 jour(s)

14h

Tarif

1500 € HT

HT