Description
Objectifs de formation : à l’issue de la formation, le stagiaire sera capable de mettre en œuvre une solution de recherche performante de données volumineuses avec ElasticSearch.
Objectifs pédagogiques
- Situer Elasticsearch dans un écosystème Big Data
- Identifier les enjeux et les cas d'utilisation d'un moteur de recherche
- Appréhender le fonctionnement d'ElasticSearch
- Savoir installer et configurer ElasticSearch
- Indexer des volumes importants de données
- Comprendre comment administrer le système et le surveiller afin de garantir sa disponibilité
Public concerné
Administrateur système
Architectes
Développeurs
Data Analysts
Data Engineers
Prérequis
Disposer de solides bases en administration système Unix/Linux
Déroulé du programme
1
Présentation des moteurs de recherche
- Définitions & tour d'horizon des outils Open Source
- Implémentation d'un moteur de recherche au sein d'une App
- Enjeux & clés de succès
- Présentation d'Elasticsearch & historique des versions
2
Le projet Elasticsearch
- Historique du projet
- Apache Lucene
- Comparatif Elascticsearch / Lucene
3
Premiers pas sur Elasticsearch
- Fonctionnement en Cluster
- Installation & paramétrage
- Définitions : Node, Index & type
- Partitionnement de données
- API Rest
4
Observabilité
- Monitoring
- Logs
- Metrics
- Traces API
- Envoyer des données depuis un serveur Elastic
- Données métriques d'expédition // Données de journal d'expédition
- APM
- Applications d'observabilité
5
Indexation
- Création d'index et des documents liés
- API Rest : suppression & indexation
- Indexation en masse
- Version
- Pondération
- Pour aller plus loin : tour d'horizon des fonctionnalités avancées
6
Mapping
- Qu'est ce que le mapping ?
- Intérêt du mapping
- Type de champs
- Focus sur les champs prédéfinis
- Méta données d'un Index
7
Analyse & extraction de texte
- Notions fondamentales de l'extraction et de l'analyse de texte : analysers, char filters, tokenizers, token filters
- Cas d'usage
- Paramétrage & manipulation des analyzers prédéfinis ou customisés
- Analyse de texte multilingue
- Suppression de mots
- Extraction d'adresses email & d'URLs
- Suppression de balises HTML
- Correction orthographique
- Indexation de fichiers binaires
8
Recherche de documents
- Recherche par l'API Rest
- Gestion des résultats
- Types de requêtes
- Requêtes & filtres
- Types de filtres
- Combinaison de filtres
- Pertinence & score
- Suggestions
- Autocomplétion
- Highlighting
- Recherche Objets / Nested / Parent-Enfant
- More Like This
- Recherche géospatiale
9
Elasticsearch & API Java
- Types de clients disponibles
- Intégration Java / Elasticsearch
- API Java
- Indexation & recherche de documents
- Gestion des index
- Gestion des mappings
10
Cloud & clusterisation
- Fonctionnement d'un cluster Elasticsearch
- Split brains
- Paramétrage du cluster
- Scalabilité & volumétrie de données
- Sauvegarde & restauration du cluster
- Supervision du cluster
11
Pour aller plus loin
- Plugins Elasticsearch
- River
- Scripting
- Pré-chauffage du cluster
- Percolation
- Maintenance des nodes
- Répartition des indexes sur différents nodes
- Requêtes et statistiques
Informations
Durée
2 jour(s)
14h
Tarif
1500 € HT
HT
Formations similaires
IA & Data
Migration vers le Cloud
2 jour(s)
Sur demande
IA & Data
Agents IA — Concevoir des systèmes autonomes avec LangChain et LangGraph - Avancé
3 jour(s)
Sur demande
IA & Data
AI Act européen — Comprendre vos obligations et vous mettre en conformité - Niveau débutant
1 jour(s)
Sur demande
IA & Data
Analyse des données avec Microsoft Power BI (4-167)
3 jour(s)
2200 € HT