Description
Objectif de formation : Cette formation vous apprendra à utiliser Python dans le cadre de Data Analytics et d'aides décisionnelles
Objectifs pédagogiques
- Maîtriser le principe de la modélisation statistique
- Comparer la régression et la classification et faire un choix en fonction du type de données
- Mesurer les performances prédictives d'un algorithme
- Concevoir des sélections et des classements dans de grands volumes de données pour dégager des tendances
Public concerné
Responsables Infocentre
Utilisateurs et gestionnaires métiers de bases de données
Prérequis
Connaissances de base en Python
Connaissances de base en statistiques
Déroulé du programme
1
Introduction à la modélisation
- Présentation du langage Python
- Présentation du logiciel Jupiter Notebook
- Définition des jalons de construction d'un modèle
- Comparatif algorithmes supervisés & non supervisés
- Différences entre régression et classification
2
Procédures d'évaluation de modèles
- Ré-échantillonnage en jeu d'apprentissage
- Techniques de validation et de test
- Test de représentativité des données d'apprentissage
- Évaluation de performance des modèles prédictifs
- Matrice de confusion, de coût et la courbe ROC et AUC
3
Algorithmes supervisés
- Principe de régression linéaire univariée
- Régression multivariée
- Régression polynomiale
- Régression régularisée
- Naive Bayes
- Régression logistique
4
Algorithmes non supervisés
- Clustering hiérarchique
- Clustering non hiérarchique
- Approches mixtes
5
Analyse en composantes
- Analyse en composantes principales
- Analyse factorielle des correspondances
- Analyse des correspondances multiples
- Analyse factorielle pour données mixtes
- Classification hiérarchique sur composantes principales
6
Analyse de données textuelles
- Collecte et prétraitement des données textuelles
- Extraction d'entités primaires, d'entités nommées et résolution référentielle
- Étiquetage grammatical, analyse syntaxique, analyse sémantique.
- Lemmatisation
- Représentation vectorielle des textes
- Pondération TF-IDF
- Word2Vec
Informations
Durée
4 jour(s)
28h
Tarif
2700 € HT
HT
Formations similaires
IA & Data
Migration vers le Cloud
2 jour(s)
Sur demande
IA & Data
Agents IA — Concevoir des systèmes autonomes avec LangChain et LangGraph - Avancé
3 jour(s)
Sur demande
IA & Data
AI Act européen — Comprendre vos obligations et vous mettre en conformité - Niveau débutant
1 jour(s)
Sur demande
IA & Data
Analyse des données avec Microsoft Power BI (4-167)
3 jour(s)
2200 € HT