Data Science – Programmation R

0 Enrolled
21 heures
  • 21 heures
  • 56
  • 0
  • no
2,100.00€

Aperçu du cours

Objectif de formation : Au terme de la formation l’apprenant aura pris en main le langage de programmation R et détiendra des compétences de base en Data Science grâce à lui.

Prérequis

  • Avoir des connaissances en Machine Learning
  • Avoir des bases en programmation R

Objectifs pédagogiques

  • Savoir utiliser la bibliothèque H2O
  • Manipuler les modèles de Machine Learning et de Deep Learning sous H2O
  • Reconnaître les cas d'utilisation avec Spark

Public ciblé

  • Statisticiens
  • Consultants Big Data
  • Data analysts
  • Data scientists

Programme de formation

  • Introduction au Machine Learning

    • Présentation des notions de bases

    • Modèles & Machine Learning

    • Deep Learning

    • AutoML

  • Présentation d'H2O

    • Notions et cas d’usages

    • Installation

    • Introduction à R

    • Travaux pratiques : installation et première utilisation d’H2O

  • Arbres et forêts

    • Définitions

    • Arbres de décisions

    • Random Forest & H2O

    • Gradient Boosting Machine & H2O

    • Overfitting & train / validation / test

    • Validation croisée & H2O

    • Travaux pratiques : création d’arbres de décisions et études des résultats

  • Modèles linéaires

    • Définitions

    • Régression linéaire

    • Régression logistique

    • Naïve bayésien

    • Hyperparamètre

    • Travaux pratiques : création d’une régression et études des résultats

  • Data Manipulation

    • Chargement et exportation de la donnée sous H2O

    • Exploration de la donnée

    • Manipulation de la donnée

  • Deep learning H2O

    • Réseaux neuronaux

    • Deep learning & le Grid Search

    • Régression en Deep Learning

  • Architecture et sécurité sous H2O

    • H2O Stack logiciel

    • API REST

    • Interaction avec R

    • Sécurisation des modèles

    • SSL Sécurité

  • Présentation du Sparkling Water

    • Cas d’utilisation nominale

    • Construction de modèles

    • Le munging de données

    • Les processus en stream

    • Présentation des fonctionnalités

    • Les sources de données supportées

    • Formats de données supportées

    • Environnements d’exécutions Spark supportés

  • API H2O

    • Démarrage des services H2O

    • L’allocation mémoire

    • Conversion d’H2OFrame : RDD & DataFrame

    • Convertion du RDD et DataFrame au H2OFrame

    • Création d’un H2OFrame à partir d’une clé existante

    • Le mapping des types entre H2OFrame et Spark DataFrame

    • Appeler les algorithmes H2O

    • Utilisation de Spark Data Sources avec H2OFrame

    • H2OFrame : lecture & enregistrement

    • Chargement et sauvegarde des options

    • Spécification du mode d’enregistrement à appliquer

  • H2O en production

    • POJO & MOJO

    • MOJO Quick Start

    • POJO Quick Start

    • Illustrations de design patterns

    • Ressources supplémentaires

Instructeur

Avatar de l’utilisateur

bprigent

0.0
0 commentaire
0 Students
491 Courses
Main Content