Formation en IA & Data: Big Data - Analyse de données - Ascent Formation
Retour aux formations
IA & Data

Big Data - Analyse de données

5 jour(s)35h

Description

Objectif de formation : Appréhender les enjeux et intérêts du Big Data, puis découvrir les différents outils.

Objectifs pédagogiques

  • Maîtriser les notions clés et les intérêts du Big Data vis-à-vis des enjeux métiers
  • Appréhender l'environnement technologique nécessaire pour créer et déployer un projet Big Data
  • Détenir les connaissances techniques pour manipuler et administrer des flux de données complexes, non structurés et massifs
  • Mettre en oeuvre des modèles d'analyses statistiques pour répondre aux besoins métiers
  • Manipuler un outil de data visualisation pour concevoir des analyses dynamiques

Public concerné

Dataminers
Chargés d'études statistiques
Développeurs
Chefs de projet
Consultants en informatique décisionnelle

Prérequis

Connaissances de base des modèles relationnels, des statistiques et des langages de programmation
Connaissances de base des concepts de la Business Intelligence

Déroulé du programme

1

Introduction : notions & enjeux du Big Data

  • Histoire et terminologie du Big Data
  • Le Big Data aujourd'hui : chiffres clés Monde et France
  • Tour d'horizon des enjeux du Big Data
  • Travaux pratiques : analyse d'une architecture Big Data
2

Technologies du Big Data

  • Étude de l'architecture et des composants d'Hadoop
  • Présentation des modes de stockage
  • Principes de fonctionnement de MapReduce, Spark, Storm...
  • Tour d'horizon des différentes distributions du marché
  • Installation d'une plateforme Hadoop
  • Datascientist : missions et défis
  • Introduction aux technologies spécifiques pour la data visualisation
  • Travaux pratiques : Implémentation d'une plateforme Big Data Hadoop
3

Traitement des données structurées & non structurées

  • Fonctionnement de Hadoop Distributed File System
  • Importation des données externes vers HDFS
  • Déployer des requêtes SQL avec HIVE
  • Utilisation de PIG pour le traitement de la donnée
  • Principe des ETL
  • Utilisation de streaming de données massive
  • Travaux pratiques : Mise en oeuvre de flux de données massives
4

Technique & méthodes Big Data analytics

  • Introduction au Machine Learning & à l'IA
  • Régression, Classification & Clustering
  • Travail en amont : préparation des données
  • Génération des modèles en R ou Python
  • Ensemble Learning
  • Présentation des outils du marché
  • Exercice : Mise en oeuvre d'analyses
5

Data visualisation & cas d'usage concrets

  • Définition du besoin de la data visualisation
  • Analyse & visualisation des données
  • Types de données & DataViz
  • Présentation des outils de DataViz du marché
  • Travaux pratiques : Implémentation & utilisation d'un outil de Data Visualisation pour concevoir des analyses dynamiques
6

Pour aller plus loin

  • Bonnes pratiques

Informations

Durée

5 jour(s)

35h

Tarif

3250 € HT

HT