IA & Data

IA Multimodale Avancée : Concevoir et déployer des systèmes combinant texte, image, audio et vidéo

2 jours • 14 heures

Description

Maîtriser les architectures et outils de l’IA multimodale afin de concevoir, intégrer et déployer des pipelines combinant texte, image, audio et vidéo dans des cas d’usage avancés.

Learning Objectives

Comprendre les architectures des modèles multimodaux modernes
Exploiter des modèles Vision-Language (CLIP, LLaVA, GPT-4V)
Mettre en œuvre des pipelines audio (transcription, analyse vocale)
Analyser et exploiter des flux vidéo avec des modèles IA
Concevoir des pipelines multimodaux complets en production
Identifier et implémenter des cas d’usage métier avancés

Target Audience

Data Scientists

Machine Learning Engineers

Architectes IA

Lead Developers IA / Data

Prerequisites

Maîtrise de Python et des librairies ML (PyTorch ou TensorFlow)

Connaissances en Deep Learning (CNN, Transformers)

Expérience avec des APIs IA (OpenAI, Google, Hugging Face)

Notions en traitement du langage naturel et vision par ordinateur

Program Outline

Informations

Duration

2 jours

14 heures

Tarif

Sur demande

Similar Trainings

IA & Data

Computer Vision – Fondamentaux et applications industrielles

3 jours

Sur demande

IA & Data

DATABRICKS – Data Engineering et Analytics sur le Lakehouse

3 jours

Sur demande

IA & Data

Big data - Open data - Les fondamentaux (4-111)

2 jours

1500€

IA & Data

DBT (Data Build Tool) – Transformer vos données avec du SQL versionné

2 jours

Sur demande