Formation en IA & Data: Architectures Data modernes : Data Mesh, Lakehouse et Data Fabric - Ascent Formation
Retour aux formations
IA & Data

Architectures Data modernes : Data Mesh, Lakehouse et Data Fabric

2 jour(s)14h

Description

Comprendre et comparer les architectures data modernes afin de choisir la stratégie la plus adaptée aux enjeux techniques, organisationnels et métiers de l’entreprise.

Objectifs pédagogiques

  • Identifier les limites d’une architecture data centralisée
  • Comprendre les principes du Data Mesh, du Data Fabric et du Lakehouse
  • Différencier les usages, avantages et limites de chaque approche
  • Évaluer les critères de choix selon le contexte de l’organisation
  • Relier les architectures data aux besoins métiers, à la gouvernance et à la scalabilité
  • Modéliser une architecture cible sur un cas concret

Public concerné

Data engineers
architectes data
CDO
responsables data
responsables de plateformes data

Prérequis

Connaître les bases des environnements data (ETL, data warehouse, data lake)
Avoir une expérience en data, BI, analytics ou architecture SI

Déroulé du programme

1

PARTIE 1- Limites du data warehouse centralisé et évolution des besoins (JOUR 1- 3h30)

3h
  • Rappels sur les architectures centralisées et leurs apports
  • Limites en matière de passage à l’échelle, de gouvernance et de réactivité
  • Nouveaux enjeux : self-service, data products, multi-domaines, IA et temps réel
  • Activité pratique : étude de cas : Analyse d’une organisation confrontée à la saturation de son modèle centralisé. Identification des freins techniques, organisationnels et métiers
2

PARTIE 2 - Data Mesh : principes, data products et federated governance (JOUR 1- 3h30)

3h
  • Les quatre principes du Data Mesh
  • Notion de data product et responsabilités par domaine
  • Gouvernance fédérée et articulation entre équipes métier et plateforme
  • Activité pratique : cas pratique : Définition de domaines data et de data products pour un cas d’entreprise. Répartition des rôles entre équipes métiers, data et gouvernance.
3

PARTIE 3- Data Fabric : métadonnées actives et intégration automatisée (jour 2- 2h30)

2h
  • Positionnement du Data Fabric dans un SI data moderne
  • Rôle des métadonnées actives, du lineage et de l’automatisation
  • Apports pour l’intégration, la qualité, la gouvernance et l’exploitation transverse
  • Activité pratique : exercice : Cartographie simplifiée d’un flux de données avec métadonnées et automatisation. Repérage des gains possibles en intégration et en gouvernance.
4

PARTIE 4 - Lakehouse : principes et technologies clés (JOUR 2- 2h30)

2h
  • Convergence entre data lake et data warehouse
  • Principes du Lakehouse pour l’analytics, la BI et les usages data avancés
  • Technologies de référence : Delta Lake, Apache Iceberg, Apache Hudi
  • Activité pratique : cas pratique : Comparaison de plusieurs options Lakehouse selon un besoin métier donné. Choix d’une technologie en fonction des contraintes de performance, gouvernance et évolutivité.
5

PARTIE 5- Comparaison des architectures et critères de choix (JOUR 2- 1h00)

1h
  • Comparaison Data Mesh, Data Fabric et Lakehouse
  • Critères de choix : maturité data, organisation, gouvernance, volumétrie, usages
  • Complémentarités et logiques hybrides selon les contextes d’entreprise
  • Activité pratique : discussion guidée : Analyse comparative de plusieurs scénarios d’architecture, Argumentation collective autour du choix de la solution la plus adaptée.
6

PARTIE 6- Cas d’usage sectoriels et TP de modélisation (JOUR 2 - 1h00)

1h
  • Exemples d’usage dans l’industrie, la banque, l’assurance, le retail ou les services
  • Facteurs de succès et points de vigilance selon les secteurs
  • Méthode de cadrage d’une architecture cible
  • Activité pratique : TP fil rouge : Modélisation d’une architecture data moderne pour un cas réel d’entreprise. Présentation et justification des choix techniques, organisationnels et de gouvernance.

Informations

Durée

2 jour(s)

14h

Tarif

Sur demande