Aperçu du cours
Trainingsdoelstelling: Aan het einde van de training zullen de deelnemers in staat zijn om gegevens te analyseren met behulp van de programmeertaal R.
Prérequis
- Sterke kennis van wiskunde: algebra, waarschijnlijkheidsrekening, statistiek
- Goede basis in IT: algoritmiek, logica
Objectifs pédagogiques
- Inzicht krijgen in de verschillen tussen Data Mining en Data Science
- Het functioneren van Machine Learning in een supervised learning-context begrijpen
- Geavanceerde technieken en concepten van de programmeertaal R beheersen
- Onbegeleide Machine Learning-algoritmen implementeren met R
Public ciblé
- Dataminers
- Data Scientists
Programme de formation
-
Inleiding tot Data Mining & Machine Learning
-
Verschil tussen Data Mining en Data Science
-
Statistisch leren versus machinaal leren
-
Iteratie en evaluatie
-
Bias-variantie-afweging
-
Fasen van een Data Mining / Data Science-project
-
-
Supervised Machine Learning: Regressie
-
Eenvoudige lineaire regressie
-
Praktijkvoorbeeld: uitleggen en voorspellen van huurprijzen op basis van woningkenmerken en voorzieningen
-
Meervoudige lineaire regressie
-
Praktijkvoorbeeld: voorspellen van de ozonconcentratie op basis van meteorologische parameters of CO₂-uitstoot voorspellen op basis van voertuigkenmerken
-
Generalisaties en niet-lineariteit
-
Beslissingsbomen voor regressie
-
Random Forest voor regressie
-
Praktijkvoorbeeld: detectie van prostaatkanker bij patiënten of klantverloop naar concurrenten voorspellen
-
-
Supervised Machine Learning: Classificatie
-
Logistische regressie
-
Praktijkvoorbeeld: uitleggen en voorspellen van borstkankerincidentie
-
Discriminantanalyse
-
Praktijkvoorbeeld: voorspellen van het type wijn op basis van chemische eigenschappen
-
K-meest nabije buren (K-NN)
-
Praktijkvoorbeeld: klantprofilering in de banksector – hoe identificeer je risicovolle profielen?
-
Bayesiaanse vernieuwing
-
Naïeve Bayes-classificatie
-
Praktijkvoorbeeld: klantverloop voorspellen of spam-e-mails detecteren
-
Support Vector Machines (SVM)
-
Praktijkvoorbeeld: klantverloop voorspellen
-
Neurale netwerken
-
-
Gevorderde onderwerpen
-
Kruisvalidering en hersteekproeftechnieken
-
Bootstrap
-
Hyperparameters
-
Ensemblemodellen
-
Gemengde modellen
-
Boosting
-
-
Unsupervised Machine Learning
-
K-means clustering
-
Praktijkvoorbeeld: automatische classificatie van plant- of vissoorten op basis van hun fysiologische kenmerken
-
Uitdagingen bij onbegeleid leren en alternatieven voor K-means
-
-
Dimensiereductie
-
Principale Componenten Analyse (PCA)
-
Praktijkvoorbeeld: typering van atleten op basis van hun prestaties op de Olympische Spelen
-
Correspondentieanalyse (CA)
-
Meervoudige correspondentieanalyse (MCA)
-
Praktijkvoorbeeld: verdeling van huishoudelijke taken of studie naar sportvoorzieningen in Franse gemeenten
-