RAG (Retrieval-Augmented Generation) — Concevoir un assistant IA fiable connecté à vos données internes
Description
Cette formation permet à des professionnels techniques de concevoir un système RAG capable d’interroger un corpus documentaire interne et de produire des réponses contextualisées, traçables et plus fiables qu’un LLM utilisé seul. Elle combine compréhension architecturale, choix technologiques, mise en œuvre pratique et évaluation, avec une logique directement exploitable dans des contextes d’entreprise : documentation technique, support interne, procédures qualité, base RH ou référentiels métier. Les approches retenues sont cohérentes avec les bonnes pratiques actuelles du marché, où la qualité des données, le chunking, le retrieval et l’évaluation conditionnent la performance réelle d’un projet RAG
Objectifs pédagogiques
- Comprendre les principes, bénéfices et limites d’une architecture RAG dans un contexte d’entreprise.
- Concevoir une chaîne complète d’ingestion, de vectorisation, d’indexation, de retrieval et de génération.
- Comparer plusieurs stratégies de choix de modèles selon les contraintes de coût, de confidentialité, de performance et d’architecture.
- Mettre en œuvre une base vectorielle adaptée au besoin métier et au système d’information existant.
- Optimiser le chunking, l’indexation et les stratégies de recherche pour améliorer la pertinence des réponses.
- Évaluer la qualité d’un système RAG avec des indicateurs dédiés, notamment la faithfulness et la relevancy.
- Définir les conditions de déploiement d’un RAG exploitable, maintenable et gouverné en environnement professionnel.
Public concerné
Prérequis
Déroulé du programme
Partie 1 — Positionner le RAG dans une architecture d’IA générative d’entreprise (Jour 1- 3h00)
- Situer le RAG dans l’écosystème de l’IA générative
- Comprendre les composants d’une architecture RAG
- Identifier les enjeux de cadrage en entreprise
- Activité pratique : étude de cadrage d’un cas métier (Analyser un besoin type grand compte : assistant interne sur procédures qualité, documentation technique ou support IT. Définir le périmètre fonctionnel, les sources documentaires, les utilisateurs visés et les critères d’acceptation du futur système)
Partie 2 — Choisir les modèles, embeddings et briques techniques (Jour 1- 4h00)
- Comparer les familles de modèles mobilisables dans un projet RAG
- Comprendre le rôle des embeddings
- Étudier les principales options de stockage vectoriel
- Définir des critères de choix techniques réalistes
- Activité pratique : atelier d’aide à la décision technique (Comparer plusieurs combinaisons modèle + embeddings + base vectorielle à partir d’un cahier des charges type. Produire une recommandation argumentée d’architecture adaptée à un contexte entreprise.)
Partie 3 — Préparer les données : chunking, enrichissement et indexation (Jour 2- 3h00)
- Préparer un corpus documentaire pour le RAG
- Concevoir une stratégie de chunking pertinente
- Indexer un corpus de manière exploitable
- Activité pratique : atelier d’optimisation du corpus (Tester plusieurs stratégies de chunking sur un même corpus documentaire métier. Mesurer les écarts de qualité de récupération selon la structure retenue et ajuster les métadonnées)
Partie 4 — Construire la chaîne complète : ingestion, retrieval et génération (Jour 2- 4h00)
- Assembler un pipeline RAG de bout en bout
- Mettre en œuvre des stratégies de retrieval plus robustes
- Orchestrer le pipeline avec des frameworks adaptés
- Préparer une réponse de qualité côté utilisateur
- Activité pratique : TP de construction d’un RAG fonctionnel (Développer un pipeline complet sur un corpus documentaire métier fourni en formation. Interroger le système, analyser les réponses obtenues et améliorer la qualité du retrieval avant génération.)
Partie 5 — Évaluer la qualité réelle d’un système RAG (Jour 3- 3h00)
- Comprendre ce qu’il faut évaluer dans un projet RAG
- Découvrir les approches d’évaluation adaptées
- Identifier les causes fréquentes d’échec
- Activité pratique : atelier d’évaluation et d’amélioration (Évaluer le pipeline construit sur un lot de questions métier et repérer les erreurs de retrieval ou de génération. Corriger les paramètres clés du système pour améliorer la qualité mesurée des réponses.)
Partie 6 — Industrialiser un RAG en entreprise (Jour 3- 4h00)
- Définir une architecture RAG exploitable en production
- Sécuriser l’accès aux données et gouverner le système
- Mettre en place de bonnes pratiques d’exploitation
- Préparer une feuille de route de déploiement
- Activité pratique : projet fil rouge de synthèse (Finaliser un assistant documentaire RAG répondant à un cas d’usage métier réaliste, avec sources, retrieval optimisé et réponses fiabilisées. Présenter l’architecture retenue, les choix techniques, les résultats d’évaluation et les recommandations de déploiement.)
Informations
Durée
3 jour(s)
21h
Sur demande
Formations similaires
Migration vers le Cloud
Sur demande
Agents IA — Concevoir des systèmes autonomes avec LangChain et LangGraph - Avancé
Sur demande
AI Act européen — Comprendre vos obligations et vous mettre en conformité - Niveau débutant
Sur demande
Analyse des données avec Microsoft Power BI (4-167)
2200 € HT