Retour aux formations
IA & Data
dbt (Data Build Tool) – Transformer vos données avec du SQL versionné
2 jour(s) • 14h
Description
Maîtriser dbt pour concevoir, tester et documenter des pipelines de transformation de données robustes, versionnés et industrialisables dans un environnement moderne de type ELT.
Objectifs pédagogiques
- Comprendre la philosophie DBT et l’approche Analytics Engineering
- Installer et configurer un projet DBT (Core / Cloud)
- Créer et organiser des modèles SQL (models, sources, seeds, snapshots)
- Mettre en place des tests et de la documentation automatisée
- Utiliser Jinja et les macros pour industrialiser les transformations
- Intégrer DBT dans une chaîne CI/CD
- Construire un projet DBT complet sur un entrepôt de données
Public concerné
Data engineers
Data analysts
Analytics engineers
Prérequis
Bonne maîtrise du SQL
Connaissance des bases d’un Data Warehouse (Snowflake, BigQuery, Redshift…)
Notions de Git recommandées
Déroulé du programme
1
Jour 1
2
Module 1 / Introduction à dbt et Analytics Engineering (2h)
2h
3
Concepts ELT vs ETL
4
Positionnement de dbt dans la Modern Data Stack
5
Rôle de l'Analytics Engineer
6
Architecture d'un projet dbt
7
Activité pratique : étude de cas
8
Analyse d'un pipeline data existant (ETL classique)
9
Identification des améliorations possibles avec dbt
10
Module 2 / Installation et configuration dbt (2h)
2h
11
dbt Core vs dbt Cloud
12
Installation et setup environnement
13
Connexion à un Data Warehouse (Snowflake / BigQuery)
14
Initialisation d'un projet dbt
15
Activité pratique : exercice guidé
16
Installation de dbt et création d'un projet
17
Connexion à une base de données et exécution d'un premier modèle
18
Module 3 / Models, sources et seeds (3h)
3h
19
Création de modèles SQL (models)
20
Référencement avec ref() et source()
21
Gestion des sources
22
Utilisation des seeds (CSV)
23
Bonnes pratiques de structuration
24
Activité pratique : cas pratique
25
Création de modèles staging et marts
26
Intégration de données via seeds et construction d'un premier pipeline
27
Jour 2
28
Module 4 / Tests et documentation (2h)
2h
29
Tests natifs (not null, unique, relationships)
30
Tests personnalisés
31
Documentation automatisée
32
Génération du site de documentation
33
Activité pratique : exercice
34
Ajout de tests sur un modèle existant
35
Génération et analyse de la documentation dbt
36
Module 5 / Jinja, macros et snapshots (2h30)
2h
37
Introduction à Jinja
38
Création de macros réutilisables
39
Paramétrisation des modèles
40
Gestion de l'historisation avec snapshots
41
Activité pratique : cas pratique
42
Création d'une macro personnalisée
43
Mise en place d'un snapshot pour historiser les données
44
Module 6 / Packages dbt et intégration CI/CD (1h30)
1h
45
Utilisation des packages dbt (dbt-utils...)
46
Gestion des dépendances
47
Intégration avec Git
48
Introduction à la CI/CD (GitHub Actions / dbt Cloud)
49
Activité pratique : exercice
50
Installation d'un package dbt
51
Simulation d'un pipeline CI simple (test + run)
52
Module 7 / TP final : projet dbt complet (1h)
1h
53
Construction d'un pipeline complet
54
Mise en place des tests, documentation et macros
55
Structuration du projet selon les bonnes pratiques
56
Création d'un pipeline de transformation de bout en bout
57
Validation avec tests et documentation
Informations
Durée
2 jour(s)
14h
Tarif
Sur demande
Formations similaires
IA & Data
Migration vers le Cloud
2 jour(s)
Sur demande
IA & Data
Agents IA — Concevoir des systèmes autonomes avec LangChain et LangGraph - Avancé
3 jour(s)
Sur demande
IA & Data
AI Act européen — Comprendre vos obligations et vous mettre en conformité - Niveau débutant
1 jour(s)
Sur demande
IA & Data
Analyse des données avec Microsoft Power BI (4-167)
3 jour(s)
2200 € HT