Back to trainings
IA & Data
IA Multimodale Avancée : Concevoir et déployer des systèmes combinant texte, image, audio et vidéo
2 jours • 14 heures
Description
Maîtriser les architectures et outils de l’IA multimodale afin de concevoir, intégrer et déployer des pipelines combinant texte, image, audio et vidéo dans des cas d’usage avancés.
Learning Objectives
- Comprendre les architectures des modèles multimodaux modernes
- Exploiter des modèles Vision-Language (CLIP, LLaVA, GPT-4V)
- Mettre en œuvre des pipelines audio (transcription, analyse vocale)
- Analyser et exploiter des flux vidéo avec des modèles IA
- Concevoir des pipelines multimodaux complets en production
- Identifier et implémenter des cas d’usage métier avancés
Target Audience
Data Scientists
Machine Learning Engineers
Architectes IA
Lead Developers IA / Data
Prerequisites
Maîtrise de Python et des librairies ML (PyTorch ou TensorFlow)
Connaissances en Deep Learning (CNN, Transformers)
Expérience avec des APIs IA (OpenAI, Google, Hugging Face)
Notions en traitement du langage naturel et vision par ordinateur
Program Outline
Informations
Duration
2 jours
14 heures
Tarif
Sur demande
Similar Trainings
IA & Data
Computer Vision – Fondamentaux et applications industrielles
3 jours
Sur demande
IA & Data
DATABRICKS – Data Engineering et Analytics sur le Lakehouse
3 jours
Sur demande
IA & Data
Big data - Open data - Les fondamentaux (4-111)
2 jours
1500€
IA & Data
DBT (Data Build Tool) – Transformer vos données avec du SQL versionné
2 jours
Sur demande