Aperçu du cours
Opleidingsdoel: Ontwikkelen van applicaties met behulp van verschillende tools en begrijpen van datavisualisatie en de toepassingen ervan.
Prérequis
- Beheersing van gevorderde wiskunde
- Bekwaam in Python
Objectifs pédagogiques
- Applicaties maken met Spark
- Gebruik maken van parallel programmeren op een cluster
- Begrijpen en toepassen van standaard machine learning-algoritmes
- De Python-bibliotheek gebruiken voor machine learning
- Het verloop van een data science-project begrijpen
Public ciblé
- Ontwikkelaars, Data-analisten, Data scientists, Big Data-experts...
Programme de formation
-
Overzicht van Big Data
-
Introductie tot Big Data
-
Definitie
-
Kansen en voordelen van Big Data
-
De Big Data-markt
-
Big Data ontrafelen
-
De technologieën van Big Data
-
De beroepen in Big Data
-
-
Python, wiskunde en SQL
-
Python
-
Basiswiskunde: algebra, statistiek, waarschijnlijkheid
-
SQL
-
-
Machine Learning-algoritmen
-
Kernconcepten van ML
-
Geleide gegevens versus ongeleide gegevens
-
Regressie
-
Lineaire modellen
-
Classificatie
-
Naive Bayes
-
K-NN
-
K-Means clustering
-
Deep learning en neurale netwerken
-
Beslissingsbomen en regressiebomen
-
Support Vector Machines
-
-
Machine Learning & Spark
-
Introductie tot Apache Spark
-
Spark MLlib: Machine Learning
-
Spark Streaming: real-time gegevensverwerking
-
Spark SQL: SQL-queries
-
Spark GraphX: grafiekcreatie
-
Opslag & grafieken
-
-
Data Visualisatie
-
Definitie
-
De markt voor Data Visualisatie
-
De tools en hun categorisatie
-
Werking van Data Visualisatie tools
-
Introductie tot verschillende Data Visualisatie tools (Kiaban, Hue, Tableau…)
-