Formation en IA & Data: Python - Big Data Analytics - Ascent Formation
Retour aux formations
IA & Data

Python - Big Data Analytics

4 jour(s)28h

Description

Objectif de formation : Cette formation vous apprendra à utiliser Python dans le cadre de Data Analytics et d'aides décisionnelles

Objectifs pédagogiques

  • Maîtriser le principe de la modélisation statistique
  • Comparer la régression et la classification et faire un choix en fonction du type de données
  • Mesurer les performances prédictives d'un algorithme
  • Concevoir des sélections et des classements dans de grands volumes de données pour dégager des tendances

Public concerné

Responsables Infocentre
Utilisateurs et gestionnaires métiers de bases de données

Prérequis

Connaissances de base en Python
Connaissances de base en statistiques

Déroulé du programme

1

Introduction à la modélisation

  • Présentation du langage Python
  • Présentation du logiciel Jupiter Notebook
  • Définition des jalons de construction d'un modèle
  • Comparatif algorithmes supervisés & non supervisés
  • Différences entre régression et classification
2

Procédures d'évaluation de modèles

  • Ré-échantillonnage en jeu d'apprentissage
  • Techniques de validation et de test
  • Test de représentativité des données d'apprentissage
  • Évaluation de performance des modèles prédictifs
  • Matrice de confusion, de coût et la courbe ROC et AUC
3

Algorithmes supervisés

  • Principe de régression linéaire univariée
  • Régression multivariée
  • Régression polynomiale
  • Régression régularisée
  • Naive Bayes
  • Régression logistique
4

Algorithmes non supervisés

  • Clustering hiérarchique
  • Clustering non hiérarchique
  • Approches mixtes
5

Analyse en composantes

  • Analyse en composantes principales
  • Analyse factorielle des correspondances
  • Analyse des correspondances multiples
  • Analyse factorielle pour données mixtes
  • Classification hiérarchique sur composantes principales
6

Analyse de données textuelles

  • Collecte et prétraitement des données textuelles
  • Extraction d'entités primaires, d'entités nommées et résolution référentielle
  • Étiquetage grammatical, analyse syntaxique, analyse sémantique.
  • Lemmatisation
  • Représentation vectorielle des textes
  • Pondération TF-IDF
  • Word2Vec

Informations

Durée

4 jour(s)

28h

Tarif

2700 € HT

HT