Retour aux formations
IA & Data
IA Multimodale Avancée : Concevoir et déployer des systèmes combinant texte, image, audio et vidéo
2 jour(s) • 14h
Description
Maîtriser les architectures et outils de l’IA multimodale afin de concevoir, intégrer et déployer des pipelines combinant texte, image, audio et vidéo dans des cas d’usage avancés.
Objectifs pédagogiques
- Comprendre les architectures des modèles multimodaux modernes
- Exploiter des modèles Vision-Language (CLIP, LLaVA, GPT-4V)
- Mettre en œuvre des pipelines audio (transcription, analyse vocale)
- Analyser et exploiter des flux vidéo avec des modèles IA
- Concevoir des pipelines multimodaux complets en production
- Identifier et implémenter des cas d’usage métier avancés
Public concerné
Data Scientists
Machine Learning Engineers
Architectes IA
Lead Developers IA / Data
Prérequis
Maîtrise de Python et des librairies ML (PyTorch ou TensorFlow)
Connaissances en Deep Learning (CNN, Transformers)
Expérience avec des APIs IA (OpenAI, Google, Hugging Face)
Notions en traitement du langage naturel et vision par ordinateur
Déroulé du programme
Informations
Durée
2 jour(s)
14h
Tarif
Sur demande
Formations similaires
IA & Data
Migration vers le Cloud
2 jour(s)
Sur demande
IA & Data
Agents IA — Concevoir des systèmes autonomes avec LangChain et LangGraph - Avancé
3 jour(s)
Sur demande
IA & Data
AI Act européen — Comprendre vos obligations et vous mettre en conformité - Niveau débutant
1 jour(s)
Sur demande
IA & Data
Analyse des données avec Microsoft Power BI (4-167)
3 jour(s)
2200 € HT