Support & Downloads

Quisque actraqum nunc no dolor sit ametaugue dolor. Lorem ipsum dolor sit amet, consyect etur adipiscing elit.

s f

Contact Info
198 West 21th Street, Suite 721
New York, NY 10010
youremail@yourdomain.com
+88 (0) 101 0000 000
Follow Us

Formation Data Science - Programmation R

           réf : BDT-DSP

Formation Python - Data Science​

Objectif de formation : Dans cette formation, vous apprendrez à utiliser R pour effectuer des tâches d’analyse de données telles que l’importation et le nettoyage de données, la réalisation d’analyses statistiques et la création de visualisations. Vous apprendrez également les compétences de base de la science des données, telles que l’apprentissage automatique et l’exploration de texte.

Objectifs pédagogiques

  • Savoir utiliser la bibliothèque H2O
  • Manipuler les modèles de Machine Learning et de Deep Learning sous H2O
  • Reconnaître les cas d’utilisation avec Spark

Pré-requis

Avoir des connaissances en Machine Learning

Avoir des bases en programmation R

Public concerné

Statisticiens, consultants Big Data, data analysts, data scientists…

Programme de formation Data Science

  • Présentation des notions de bases
  • Modèles & Machine Learning
  • Deep Learning
  • AutoML
  • Notions et cas d’usages
  • Installation
  • Introduction à R

Travaux pratiques

Installation et première utilisation d’H2O

  • Définitions
  • Arbres de décisions
  • Random Forest & H2O
  • Gradient Boosting Machine & H2O
  • Overfitting & train / validation / test
  • Validation croisée & H2O

Travaux pratiques

Création d’arbres de décisions et études des résultats

  • Définitions
  • Régression linéaire
  • Régression logistique
  • Naïve bayésien
  • Hyperparamètre

Travaux pratiques

Création d’une régression et études des résultats

  • Chargement et exportation de la donnée sous H2O
  • Exploration de la donnée
  • Manipulation de la donnée
  • Réseaux neuronaux
  • Deep learning & le Grid Search
  • Régression en Deep Learning
  • H2O Stack logiciel
  • API REST
  • Interaction avec R
  • Sécurisation des modèles
  • SSL Sécurité
  • Cas d’utilisation nominale
  • Construction de modèles
  • Le munging de données
  • Les processus en stream
  • Présentation des fonctionnalités
  • Les sources de données supportées
  • Formats de données supportées
  • Environnements d’exécutions Spark supportés
  • Démarrage des services H2O
  • L’allocation mémoire
  • Conversion d’H2OFrame : RDD & DataFrame
  • Convertion du RDD et DataFrame au H2OFrame
  • Création d’un H2OFrame à partir d’une clé existante
  • Le mapping des types entre H2OFrame et Spark DataFrame
  • Appeler les algorithmes H2O
  • Utilisation de Spark Data Sources avec H2OFrame
  • H2OFrame : lecture & enregistrement
  • Chargement et sauvegarde des options
  • Spécification du mode d’enregistrement à appliquer
  • POJO & MOJO
  • MOJO Quick Start
  • POJO Quick Start
  • Illustrations de design patterns
  • Ressources supplémentaires

Équipe pédagogique

Professionnel expert techniques et pédagogique

Moyens pédagogiques et techniques

  • Espace intranet de formation.
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Dispositif de suivi

  • Émargement numérique.
  • Mises en situation.
  • Formulaires d’évaluation de la formation.
  • Certificat de réalisation de l’action de formation Data Science.

Vous avez une question ?