Aperçu du cours
Objectif de formation : Cette formation vous apprendra à utiliser Python dans le cadre de Data Analytics et d’aides décisionnelles
Programme d'études
Introduction à la modélisation
Présentation du langage Python
Présentation du logiciel Jupiter Notebook
Définition des jalons de construction d’un modèle
Comparatif algorithmes supervisés & non supervisés
Différences entre régression et classification
Procédures d'évaluation de modèles
Ré-échantillonnage en jeu d’apprentissage
Techniques de validation et de test
Test de représentativité des données d’apprentissage
Évaluation de performance des modèles prédictifs
Matrice de confusion, de coût et la courbe ROC et AUC
Algorithmes supervisés
Principe de régression linéaire univariée
Régression multivariée
Régression polynomiale
Régression régularisée
Naive Bayes
Régression logistique
Algorithmes non supervisés
Clustering hiérarchique
Clustering non hiérarchique
Approches mixtes
Analyse en composantes
Analyse en composantes principales
Analyse factorielle des correspondances
Analyse des correspondances multiples
Analyse factorielle pour données mixtes
Classification hiérarchique sur composantes principales
Analyse de données textuelles
Collecte et prétraitement des données textuelles
Extraction d’entités primaires, d’entités nommées et résolution référentielle
Étiquetage grammatical, analyse syntaxique, analyse sémantique.
Lemmatisation
Représentation vectorielle des textes
Pondération TF-IDF
Word2Vec