Aperçu du cours
Objectif de formation : Développer à l’aide de divers outils des applications et comprendre la data visualisation & ses usages
Prérequis
- Maîtriser les mathématiques avancées
- Savoir manipuler Python
Objectifs pédagogiques
- Créer des applications avec Spark
- Exploiter la programmation parallèle sur un cluster
- Appréhender et utiliser les algorithmes standards de Machine Learning
- Utiliser la bibliothèque Python pour le Machine Learning
- Comprendre le cycle d’un projet Data Science
Public ciblé
- Développeur, Data analysts, Data scientists, experts en Big Data...
Programme de formation
-
Tour d'horizon du Big Data
-
Présentation du Big Data
-
Définition
-
Enjeux et apports du Big Data
-
Le marché du Big Data
-
Démystifier le Big Data
-
Les technologies du Big Data
-
Les métiers du Big Data
-
-
Python, les mathématiques et SQL
-
Python
-
Les mathématiques de base: algèbre, statistiques, probabilités
-
SQL
-
-
Les algorithmes du Machine Learning
-
Les notions clés du ML
-
Les données supervisées vs les données non-supervisées
-
Régression
-
Les modèles linéaires
-
Classification
-
Naive Bayer
-
K-NN
-
K-Means clustering
-
Le deep learning et les réseaux neuronaux
-
Les arbres de décisions et de régression
-
Support Vector Machines
-
-
Machine Learning & Spark
-
Présentation d’Apache Spark
-
Spark MLlib : le Machine Learning
-
Spark Streaming : le traitement des données en temps réel
-
Spark SQL : les requêtes SQL
-
Spark GraphX : création de graphe
-
Le stockage & les graphes
-
-
La Data Visualisation
-
Définition
-
Le marché de la Data Visualisation
-
Les outils et leur catégorisation
-
Le fonctionnement des outils de Data Visualisation
-
Présentation de plusieurs outils de Data Visualisation (Kiaban, Hue, Tableau…)
-