Aperçu du cours
Objectif de formation : Au terme de la formation l’apprenant aura pris en main le langage de programmation R et détiendra des compétences de base en Data Science grâce à lui.
Prérequis
- Avoir des connaissances en Machine Learning
- Avoir des bases en programmation R
Objectifs pédagogiques
- Savoir utiliser la bibliothèque H2O
- Manipuler les modèles de Machine Learning et de Deep Learning sous H2O
- Reconnaître les cas d'utilisation avec Spark
Public ciblé
- Statisticiens
- Consultants Big Data
- Data analysts
- Data scientists
Programme de formation
-
Introduction au Machine Learning
-
Présentation des notions de bases
-
Modèles & Machine Learning
-
Deep Learning
-
AutoML
-
-
Présentation d'H2O
-
Notions et cas d’usages
-
Installation
-
Introduction à R
-
Travaux pratiques : installation et première utilisation d’H2O
-
-
Arbres et forêts
-
Définitions
-
Arbres de décisions
-
Random Forest & H2O
-
Gradient Boosting Machine & H2O
-
Overfitting & train / validation / test
-
Validation croisée & H2O
-
Travaux pratiques : création d’arbres de décisions et études des résultats
-
-
Modèles linéaires
-
Définitions
-
Régression linéaire
-
Régression logistique
-
Naïve bayésien
-
Hyperparamètre
-
Travaux pratiques : création d’une régression et études des résultats
-
-
Data Manipulation
-
Chargement et exportation de la donnée sous H2O
-
Exploration de la donnée
-
Manipulation de la donnée
-
-
Deep learning H2O
-
Réseaux neuronaux
-
Deep learning & le Grid Search
-
Régression en Deep Learning
-
-
Architecture et sécurité sous H2O
-
H2O Stack logiciel
-
API REST
-
Interaction avec R
-
Sécurisation des modèles
-
SSL Sécurité
-
-
Présentation du Sparkling Water
-
Cas d’utilisation nominale
-
Construction de modèles
-
Le munging de données
-
Les processus en stream
-
Présentation des fonctionnalités
-
Les sources de données supportées
-
Formats de données supportées
-
Environnements d’exécutions Spark supportés
-
-
API H2O
-
Démarrage des services H2O
-
L’allocation mémoire
-
Conversion d’H2OFrame : RDD & DataFrame
-
Convertion du RDD et DataFrame au H2OFrame
-
Création d’un H2OFrame à partir d’une clé existante
-
Le mapping des types entre H2OFrame et Spark DataFrame
-
Appeler les algorithmes H2O
-
Utilisation de Spark Data Sources avec H2OFrame
-
H2OFrame : lecture & enregistrement
-
Chargement et sauvegarde des options
-
Spécification du mode d’enregistrement à appliquer
-
-
H2O en production
-
POJO & MOJO
-
MOJO Quick Start
-
POJO Quick Start
-
Illustrations de design patterns
-
Ressources supplémentaires
-