Aperçu du cours
Natural Language Processing (NLP) is een tak van kunstmatige intelligentie die computers helpt bij het begrijpen, interpreteren en manipuleren van menselijke taal. NLP is geïnspireerd door verschillende disciplines, waaronder computerwetenschappen en computationele taalkunde, om de kloof te overbruggen tussen menselijke communicatie en computerbegrip.
Deze training heeft tot doel NLP te introduceren, de nuances en context ervan te begrijpen, evenals de verwerking via vectorisatie (of “embedding”).
Prérequis
- Beheersing van Python-programmering
- Basiskennis van AI/Machine Learning
Objectifs pédagogiques
- Begrijpen van NLU-technologieën en architecturen voor implementatie
- Toepassen van gestructureerde semantische modellen op informatieopvraagtoepassingen
- Toepassen van NLP-modellen om semantische overeenstemmingsproblemen op te lossen
- Werken met vooraf getrainde modellen gekoppeld aan een innovatieve architectuur (Transformers)
Public ciblé
- Ingenieurs
- AI-projectmanagers
- AI-consultants
- Ontwikkelaars
Programme de formation
-
Introductie tot AI, Machine Learning & NLP
-
Definitie
-
Gestructureerde en ongestructureerde gegevens
-
Voorbeelden van NLP-toepassingen
-
Verband met Machine Learning
-
-
Corpus creëren, tekst schoonmaken en dimensiereductie toepassen
-
Zoeken in tekststrings en teksttransformatie
-
Definitie van regex en basisfuncties voor tekstreiniging
-
Belang van dimensiereductie
-
Verschil tussen dimensievermindering en dimensiereductie
-
Overzicht van klassieke methoden voor reductie (harmonisatie, spellingscorrectie, synoniemen, stopwoorden, lemmatisering en stemming)
-
Praktische oefening: functies bouwen voor tekstreiniging en normalisatie in het Frans (accenten, speciale tekens, lemmatisering, stemming, stopwoorden, …)
-
-
Gegevens structureren in scorematrices (statistische modellen)
-
Inleiding tot terminologie
-
Term-document matrix
-
Definitie van tokens en n-grams
-
Klassieke statistische modellen in NLP: Word Count, TF-IDF
-
Invloed van gegevens op de keuze van indicatoren
-
Praktische oefening: expressies extraheren uit klantcommentaren
-
-
Ontwikkeling van een leeralgoritme
-
Opfrissing Machine Learning
-
Binaire classificatie (Logistische Regressie, Naïve Bayes, SVM en Random Forest)
-
Praktische oefening: toepassing op een polariteitsclassifier (positief/negatief)
-
-
Feature-engineering en semantische gelijkenis
-
Herhaling van analysetools voor afstandsmeting (Manhattan, Jaccard, Cosinus, …)
-
Bepaling van semantische gelijkenis tussen documenten
-
Praktische oefening: semantische matching van CV’s en vacatures
-
Praktische oefening: ontwikkeling van een tweede-generatie chatbot (voor FAQ)
-
-
Deep Learning & Transformer-architecturen
-
Word Embedding
-
Herhaling van RNN
-
“Attention is all you need”
-
Voorgetrainde BERT-modellen
-
NLP/DL-bibliotheken: PyTorch, Hugging Face en spaCy
-
Praktische oefening: BERT manipuleren voor een use case en gebruik van PyTorch & Hugging Face
-