IA & Data

Geavanceerde multimodale AI: Systemen ontwerpen en implementeren met tekst, beeld, audio en video

2 jour(s) • 14h

Beschrijving

Multimodale AI-architecturen en -tools beheersen om pipelines te ontwerpen, integreren en implementeren die tekst, beeld, audio en video combineren voor geavanceerde use cases.

Leerdoelen

De architecturen van moderne multimodale modellen begrijpen
Vision-Language-modellen (CLIP, LLaVA, GPT-4V) benutten
Audio-pijplijnen implementeren (transcriptie, spraakanalyse)
Videostreams analyseren en exploiteren met AI-modellen
Volledige multimodale pijplijnen ontwerpen voor productie
Geavanceerde zakelijke toepassingen identificeren en implementeren

Doelgroep

datawetenschappers

machine learning engineers

AI-architecten

leidende AI/data-ontwikkelaars

Vereisten

Vloeiendheid in Python en ML-bibliotheken (PyTorch of TensorFlow)

Kennis van deep learning (CNN’s, Transformers)

Ervaring met AI-API’s (OpenAI, Google, Hugging Face)

Begrip van natuurlijke taalverwerking en computer vision

Programmaoverzicht

Informations

Duur

2 jour(s)

14h

Tarif

Sur demande

Vergelijkbare trainingen

IA & Data

Migratie naar de Cloud

2 jour(s)

Sur demande

IA & Data

AI-agenten – Autonome systemen ontwerpen met LangChain en LangGraph – Gevorderd

3 jour(s)

Sur demande

IA & Data

Europese AI Act — Uw verplichtingen begrijpen en naleving waarborgen — Beginnersniveau

1 jour(s)

Sur demande

IA & Data

Data-analyse met Microsoft Power BI (4-167)

3 jour(s)

2200 € HT