Formation en IA & Data: IA Multimodale Avancée : Concevoir et déployer des systèmes combinant texte, image, audio et vidéo - Ascent Formation
Back to trainings
IA & Data

IA Multimodale Avancée : Concevoir et déployer des systèmes combinant texte, image, audio et vidéo

2 jours14 heures

Description

Maîtriser les architectures et outils de l’IA multimodale afin de concevoir, intégrer et déployer des pipelines combinant texte, image, audio et vidéo dans des cas d’usage avancés.

Learning Objectives

  • Comprendre les architectures des modèles multimodaux modernes
  • Exploiter des modèles Vision-Language (CLIP, LLaVA, GPT-4V)
  • Mettre en œuvre des pipelines audio (transcription, analyse vocale)
  • Analyser et exploiter des flux vidéo avec des modèles IA
  • Concevoir des pipelines multimodaux complets en production
  • Identifier et implémenter des cas d’usage métier avancés

Target Audience

Data Scientists
Machine Learning Engineers
Architectes IA
Lead Developers IA / Data

Prerequisites

Maîtrise de Python et des librairies ML (PyTorch ou TensorFlow)
Connaissances en Deep Learning (CNN, Transformers)
Expérience avec des APIs IA (OpenAI, Google, Hugging Face)
Notions en traitement du langage naturel et vision par ordinateur

Program Outline

Informations

Duration

2 jours

14 heures

Tarif

Sur demande

    IA Multimodale Avancée : Concevoir et déployer des systèmes combinant texte, image, audio et vidéo | Ascent Formation | Ascent Formation