Support & Downloads

Quisque actraqum nunc no dolor sit ametaugue dolor. Lorem ipsum dolor sit amet, consyect etur adipiscing elit.

s f

Contact Info
198 West 21th Street, Suite 721
New York, NY 10010
youremail@yourdomain.com
+88 (0) 101 0000 000
Follow Us

Formation Python - Big Data Analytics

       réf : BDT-PYB

Objectif de formation : Cette formation vous apprendra à utiliser Python dans le contexte de l’analyse de données et de l’aide à la décision. Vous apprendrez à lire et à analyser des données, à construire des modèles et à prendre des décisions à l’aide de Python. La formation couvrira également des sujets tels que l’analyse de données volumineuses, l’apprentissage automatique et l’apprentissage profond. Grâce à cette formation, vous serez en mesure d’utiliser Python pour tous vos besoins en matière de données !

Objectifs pédagogiques

  • Maîtriser le principe de la modélisation statistique
  • Comparer la régression et la classification et faire un choix en fonction du type de données
  • Mesurer les performances prédictives d’un algorithme
  • Concevoir des sélections et des classements dans de grands volumes de données pour dégager des tendances

Pré-requis

Connaissances de base en Python / Connaissances de base en statistiques

Public concerné

Responsables Infocentre, Utilisateurs et gestionnaires métiers de bases de données

Programme de formation Python

  • Présentation du langage Python
  • Présentation du logiciel Jupiter Notebook
  • Définition des jalons de construction d’un modèle
  • Comparatif algorithmes supervisés & non supervisés
  • Différences entre régression et classification
  • Ré-échantillonnage en jeu d’apprentissage
  • Techniques de validation et de test
  • Test de représentativité des données d’apprentissage
  • Évaluation de performance des modèles prédictifs
  • Matrice de confusion, de coût et la courbe ROC et AUC
  • Principe de régression linéaire univariée
  • Régression multivariée
  • Régression polynomiale
  • Régression régularisée
  • Naive Bayes
  • Régression logistique
  • Clustering hiérarchique
  • Clustering non hiérarchique
  • Approches mixtes
  • Analyse en composantes principales
  • Analyse factorielle des correspondances
  • Analyse des correspondances multiples
  • Analyse factorielle pour données mixtes
  • Classification hiérarchique sur composantes principales
  • Collecte et prétraitement des données textuelles
  • Extraction d’entités primaires, d’entités nommées et résolution référentielle
  • Étiquetage grammatical, analyse syntaxique, analyse sémantique.
  • Lemmatisation
  • Représentation vectorielle des textes
  • Pondération TF-IDF
  • Word2Vec

Équipe pédagogique

Professionnel expert technique et pédagogique

Moyens pédagogiques et techniques

  • Espace intranet de formation.
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Dispositif de suivi

  • Émargement numérique.
  • Mises en situation.
  • Formulaires d’évaluation de la formation.
  • Certificat de réalisation de l’action de formation Python.

Vous avez une question ?