Formation en IA & Data: dbt (Data Build Tool) – Transformer vos données avec du SQL versionné - Ascent Formation
Retour aux formations
IA & Data

dbt (Data Build Tool) – Transformer vos données avec du SQL versionné

2 jour(s)14h

Description

Maîtriser dbt pour concevoir, tester et documenter des pipelines de transformation de données robustes, versionnés et industrialisables dans un environnement moderne de type ELT.

Objectifs pédagogiques

  • Comprendre la philosophie DBT et l’approche Analytics Engineering
  • Installer et configurer un projet DBT (Core / Cloud)
  • Créer et organiser des modèles SQL (models, sources, seeds, snapshots)
  • Mettre en place des tests et de la documentation automatisée
  • Utiliser Jinja et les macros pour industrialiser les transformations
  • Intégrer DBT dans une chaîne CI/CD
  • Construire un projet DBT complet sur un entrepôt de données

Public concerné

Data engineers
Data analysts
Analytics engineers

Prérequis

Bonne maîtrise du SQL
Connaissance des bases d’un Data Warehouse (Snowflake, BigQuery, Redshift…)
Notions de Git recommandées

Déroulé du programme

1

Jour 1

2

Module 1 / Introduction à dbt et Analytics Engineering (2h)

2h
3

Concepts ELT vs ETL

4

Positionnement de dbt dans la Modern Data Stack

5

Rôle de l'Analytics Engineer

6

Architecture d'un projet dbt

7

Activité pratique : étude de cas

8

Analyse d'un pipeline data existant (ETL classique)

9

Identification des améliorations possibles avec dbt

10

Module 2 / Installation et configuration dbt (2h)

2h
11

dbt Core vs dbt Cloud

12

Installation et setup environnement

13

Connexion à un Data Warehouse (Snowflake / BigQuery)

14

Initialisation d'un projet dbt

15

Activité pratique : exercice guidé

16

Installation de dbt et création d'un projet

17

Connexion à une base de données et exécution d'un premier modèle

18

Module 3 / Models, sources et seeds (3h)

3h
19

Création de modèles SQL (models)

20

Référencement avec ref() et source()

21

Gestion des sources

22

Utilisation des seeds (CSV)

23

Bonnes pratiques de structuration

24

Activité pratique : cas pratique

25

Création de modèles staging et marts

26

Intégration de données via seeds et construction d'un premier pipeline

27

Jour 2

28

Module 4 / Tests et documentation (2h)

2h
29

Tests natifs (not null, unique, relationships)

30

Tests personnalisés

31

Documentation automatisée

32

Génération du site de documentation

33

Activité pratique : exercice

34

Ajout de tests sur un modèle existant

35

Génération et analyse de la documentation dbt

36

Module 5 / Jinja, macros et snapshots (2h30)

2h
37

Introduction à Jinja

38

Création de macros réutilisables

39

Paramétrisation des modèles

40

Gestion de l'historisation avec snapshots

41

Activité pratique : cas pratique

42

Création d'une macro personnalisée

43

Mise en place d'un snapshot pour historiser les données

44

Module 6 / Packages dbt et intégration CI/CD (1h30)

1h
45

Utilisation des packages dbt (dbt-utils...)

46

Gestion des dépendances

47

Intégration avec Git

48

Introduction à la CI/CD (GitHub Actions / dbt Cloud)

49

Activité pratique : exercice

50

Installation d'un package dbt

51

Simulation d'un pipeline CI simple (test + run)

52

Module 7 / TP final : projet dbt complet (1h)

1h
53

Construction d'un pipeline complet

54

Mise en place des tests, documentation et macros

55

Structuration du projet selon les bonnes pratiques

56

Création d'un pipeline de transformation de bout en bout

57

Validation avec tests et documentation

Informations

Durée

2 jour(s)

14h

Tarif

Sur demande