Support & Downloads

Quisque actraqum nunc no dolor sit ametaugue dolor. Lorem ipsum dolor sit amet, consyect etur adipiscing elit.

s f

Contact Info
198 West 21th Street, Suite 721
New York, NY 10010
youremail@yourdomain.com
+88 (0) 101 0000 000
Follow Us

IA & Machine Learning - Natural Language Processing

réf : BDT-NLP

Objectif de formation : Le traitement du langage naturel NLP (Natural Language Processing) est une branche de l’intelligence artificielle qui aide les ordinateurs à comprendre, interpréter et manipuler le langage humain. Le NLP s’inspire de nombreuses disciplines, notamment l’informatique et la linguistique computationnelle, pour combler le fossé entre la communication humaine et la compréhension de l’ordinateur. Cette formation vise à présenter le NLP, à en comprendre les nuances et le contexte qui l’entoure, ainsi que le traitement par vectorisation (ou « embedding »).

Objectifs pédagogiques

  • Comprendre les technologies de NLU et les architectures pour les mettre en place
  • Appliquer des modèles sémantiques structurés sur des applications de récupération d’information
  • Appliquer les modèles NLP pour résoudre des problèmes de rapprochement sémantique
  • Manipuler des modèles pré entraînés associé à une architecture innovante (Transformers)

Pré-requis

Maîtriser la programmation python

Notions en IA/Machine learning

Public concerné

Ingénieurs

Chefs de projets IA

Consultants IA

Développeurs

Présentation de l’intervenant

Data Scientist et Data Engineer, j'utilise naturellementle Data/Text Mining et le Machine Learning. Mon péché mignon est la NLP.
David A.
Formateur IA & Data

Programme

  • Définition
  • Données structurées et non structurées
  • Exemples d’applications du NLP
  • Lien avec le Machine Learning
  • Interroger les chaînes de caractères et transformer un texte
  • Définition des regex et fonctions de base de nettoyage
  • Intérêt de la réduction de dimensionnalité
  • Différence avec la réduction de dimension
  • Présentation des méthodes classiques de réduction (Harmonisation, Correction orthographique, Synonymes, Stopwords, Lemmatisation et Stemming

Travaux pratiques

Construction de fonctions de nettoyage et normalisation pour le texte français (accents, caractères spéciaux, lemm, stem, stop words, …)

  • Présentation du vocabulaire
  • Matrice termes-documents
  • Définition des tokens et notions de n-grams
  • Modèles statistiques classiques en NLP : Word Count, TF-IDF
  • Influence des données sur le choix des indicateurs

Travaux pratiques :

Extraction d’expression caractérisant des commentaires clients

  • Rappels de Machine Learning
  • Classification binaire (Régression Logistique, Naives Bayes, SVM et Random Forest)

Travaux pratiques

Application sur un classifier de polarité de document (positif/négatif)

  • Rappels outils d’analyse de distance (Manhattan, Jaccard, Cosinus, …)
  • Qualification du rapprochement sémantique de documents

Travaux pratiques

Réalisation d’outils de rapprochement sémantique CV/poste d’emploi

Réalisation d’un chatbot 2nd generation (pour FAQ)

  • Word embedding
  • Rappels RNN
  • “Attention is all you need”
  • Modèles pré entrainés BERT
  • Library NLP / DL : PyTorch, Hugging face et spacy

Travaux pratiques :

Manipulation BERT sur “use case” et utilisation de PyTorch & Hugging Face

S'inscrire à la session

    Jours

    3 (21 heures)

    Date

    Du 18 au 20 octobre 2023

    Prix

    2100 €

    À distance

    Télécharger