Support & Downloads

Quisque actraqum nunc no dolor sit ametaugue dolor. Lorem ipsum dolor sit amet, consyect etur adipiscing elit.

s f

Contact Info
198 West 21th Street, Suite 721
New York, NY 10010
youremail@yourdomain.com
+88 (0) 101 0000 000
Follow Us

Machine Learning - Natural Language Processing

réf : BDT-NLP
Formation SAP Business Objects - Web Intelligence - Avancé

Objectif de formation : Le traitement du langage naturel NLP (Natural Language Processing) est une branche de l’intelligence artificielle qui aide les ordinateurs à comprendre, interpréter et manipuler le langage humain. Le NLP s’inspire de nombreuses disciplines, notamment l’informatique et la linguistique computationnelle, pour combler le fossé entre la communication humaine et la compréhension de l’ordinateur. Cette formation vise à présenter le NLP, à en comprendre les nuances et le contexte qui l’entoure, ainsi que le traitement par vectorisation (ou « embedding »).

Objectifs pédagogiques

  • Comprendre les technologies de NLU et les architectures pour les mettre en place
  • Appliquer des modèles sémantiques structurés sur des applications de récupération d’information
  • Appliquer les modèles NLP pour résoudre des problèmes de rapprochement sémantique
  • Manipuler des modèles pré entraînés associé à une architecture innovante (Transformers)

Pré-requis

Maîtriser la programmation python

Notions en IA/Machine learning

Public concerné

Développeurs, ingénieurs, chefs de projets, consultants…

Programme

  • Définition
  • Données structurées et non structurées
  • Exemples d’applications du NLP
  • Lien avec le Machine Learning
  • Interroger les chaînes de caractères et transformer un texte
  • Définition des regex et fonctions de base de nettoyage
  • Intérêt de la réduction de dimensionnalité
  • Différence avec la réduction de dimension
  • Présentation des méthodes classiques de réduction (Harmonisation, Correction orthographique, Synonymes, Stopwords, Lemmatisation et Stemming )

Travaux pratiques :

Construction de fonctions de nettoyage et normalisation pour le texte français (accents, caractères spéciaux, lemm, stem, stop words, …)

  • Présentation du vocabulaire
  • Matrice termes-documents
  • Définition des tokens et notions de n-grams
  • Modèles statistiques classiques en NLP : Word Count, TF-IDF
  • Influence des données sur le choix des indicateurs

Travaux pratiques

Extraction d’expression caractérisant des commentaires clients

  • Rappels de Machine Learning
  • Classification binaire (Régression Logistique, Naives Bayes, SVM et Random Forest)

Travaux pratiques :

Application sur un classifier de polarité de document (positif/négatif)

  • Rappels outils d’analyse de distance (Manhattan, Jaccard, Cosinus, …)
  • Qualification du rapprochement sémantique de documents

Travaux pratiques

Réalisation d’outils de rapprochement sémantique CV/poste d’emploi

Réalisation d’un chatbot 2nd generation (pour FAQ)

  • Word embedding
  • Rappels RNN
  • “Attention is all you need”
  • Modèles pré entrainés BERT
  • Library NLP / DL : PyTorch, Hugging face et spacy

Travaux pratiques

Manipulation BERT sur “use case” et utilisation de PyTorch & Hugging Face

Équipe pédagogique

Professionnel expert technique et pédagogique

Moyens pédagogiques et techniques

  • Espace intranet de formation.
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Dispositif de suivi

  • Émargement numérique.
  • Mises en situation.
  • Formulaires d’évaluation de la formation.
  • Certificat de réalisation de l’action de formation.

Vous avez une question ?