Aperçu du cours
Doel van de training: Begrijpen van de uitdagingen en voordelen van Big Data, en vervolgens de verschillende tools ontdekken.
Prérequis
- Basiskennis van relationele modellen, statistieken en programmeertalen
- Basiskennis van Business Intelligence-concepten
Objectifs pédagogiques
- De belangrijkste concepten en voordelen van Big Data begrijpen in relatie tot zakelijke uitdagingen.
- Het technologische milieu begrijpen dat nodig is om een Big Data-project te creëren en te implementeren.
- De technische kennis bezitten om complexe, ongestructureerde en massale gegevensstromen te manipuleren en te beheren.
- Statistische analysemethoden toepassen om zakelijke behoeften te beantwoorden.
- Een data visualisatietool gebruiken om dynamische analyses te creëren.
Public ciblé
- Dataminers
- Statistische onderzoeksmedewerkers
- Ontwikkelaars
- Projectmanagers
- Consultants in business intelligence
Programme de formation
-
Inleiding: concepten en uitdagingen van Big Data
-
Geschiedenis en terminologie van Big Data
-
Big Data vandaag de dag: belangrijke cijfers wereldwijd en in Nederland
-
Overzicht van de uitdagingen van Big Data
-
Praktijkopdracht: analyse van een Big Data-architectuur
-
-
Big Data-technologieën
-
Studie van de architectuur en componenten van Hadoop
-
Introductie van opslagmethoden
-
Werking van MapReduce, Spark, Storm…
-
Overzicht van de verschillende marktdistributies
-
Installatie van een Hadoop-platform
-
Data Scientist: missies en uitdagingen
-
Introductie van specifieke technologieën voor data visualisatie
-
Praktijkopdracht: Implementatie van een Hadoop Big Data-platform
-
-
Verwerking van gestructureerde en ongestructureerde gegevens
-
Werking van Hadoop Distributed File System
-
Importeren van externe gegevens naar HDFS
-
SQL-query’s uitvoeren met HIVE
-
Gebruik van PIG voor gegevensverwerking
-
Principe van ETL
-
Gebruik van data streaming
-
Praktijkopdracht: Implementatie van massale gegevensstromen
-
-
Techniek & methoden van Big Data-analyse
-
Introductie tot Machine Learning & AI
-
Regressie, Classificatie & Clustering
-
Voorbereiding van gegevens
-
Genereren van modellen in R of Python
-
Ensemble Learning
-
Overzicht van beschikbare tools op de markt
-
Oefening: Implementatie van analyses
-
-
Data visualisatie & praktische toepassingen
-
Definitie van de behoefte aan data visualisatie
-
Analyse & visualisatie van gegevens
-
Soorten gegevens & DataViz
-
Overzicht van de tools voor DataViz op de markt
-
Praktijkopdracht: Implementatie & gebruik van een Data Visualisation-tool voor het ontwerpen van dynamische analyses
-
-
Verdergaan
-
Best practices
-