Aperçu du cours
Objectif de formation : Au terme de la formation l’apprenant aura pris en main le langage de programmation R et détiendra des compétences de base en Data Science grâce à lui.
Programme d'études
Introduction au Machine Learning
Présentation des notions de bases
Modèles & Machine Learning
Deep Learning
AutoML
Présentation d'H2O
Notions et cas d’usages
Installation
Introduction à R
Travaux pratiques : installation et première utilisation d’H2O
Arbres et forêts
Définitions
Arbres de décisions
Random Forest & H2O
Gradient Boosting Machine & H2O
Overfitting & train / validation / test
Validation croisée & H2O
Travaux pratiques : création d’arbres de décisions et études des résultats
Modèles linéaires
Définitions
Régression linéaire
Régression logistique
Naïve bayésien
Hyperparamètre
Travaux pratiques : création d’une régression et études des résultats
Data Manipulation
Chargement et exportation de la donnée sous H2O
Exploration de la donnée
Manipulation de la donnée
Deep learning H2O
Réseaux neuronaux
Deep learning & le Grid Search
Régression en Deep Learning
Architecture et sécurité sous H2O
H2O Stack logiciel
API REST
Interaction avec R
Sécurisation des modèles
SSL Sécurité
Présentation du Sparkling Water
Cas d’utilisation nominale
Construction de modèles
Le munging de données
Les processus en stream
Présentation des fonctionnalités
Les sources de données supportées
Formats de données supportées
Environnements d’exécutions Spark supportés
API H2O
Démarrage des services H2O
L’allocation mémoire
Conversion d’H2OFrame : RDD & DataFrame
Convertion du RDD et DataFrame au H2OFrame
Création d’un H2OFrame à partir d’une clé existante
Le mapping des types entre H2OFrame et Spark DataFrame
Appeler les algorithmes H2O
Utilisation de Spark Data Sources avec H2OFrame
H2OFrame : lecture & enregistrement
Chargement et sauvegarde des options
Spécification du mode d’enregistrement à appliquer
H2O en production
POJO & MOJO
MOJO Quick Start
POJO Quick Start
Illustrations de design patterns
Ressources supplémentaires