Support & Downloads

Quisque actraqum nunc no dolor sit ametaugue dolor. Lorem ipsum dolor sit amet, consyect etur adipiscing elit.

s f

Contact Info
198 West 21th Street, Suite 721
New York, NY 10010
youremail@yourdomain.com
+88 (0) 101 0000 000
Follow Us

Data Clustering - Organisation des données

réf : BDT-DCO
Formation Rust - Programmation

Objectif de formation : Appréhender et maîtriser les notions clés du Data Clustering.

Objectifs pédagogiques

  • Appréhender les différents aspects du clustering de données
  • Connaître les méthodes, les outils et les techniques de clustering de données
  • Implémenter les outils et algorithmes pour le clustering de données
  • Pouvoir mesurer les performances et la qualité d’un jeu de données

Pré-requis

Solides bases en programmation

Public concerné

Développeurs, chefs de projets, Data analysts…

Programme

  • Présentation de la dichotomie approches supervisées & approches non supervisées
  • Méthodes floues & strictes
  • Théorie des graphes
  • Présentation des différents types de structures de données
  • Calcul de similarité
  • Propriétés des jeux de données
  • Clustering simple
  • Clusterings hiérarchiques et composés
  • Utilité du clustering hiérarchique
  • Présentation du résultat

Travaux pratiques :

Etude de cas d’utilisations de techniques de clustering

  • Approches orientées K-means
  • Approches par agglomération
  • Approches basées sur un modèle physique (modèle énergie, ressort…)
  • Approches « divisives »
  • Approches par marche aléatoire
  • Algorithmes incrémentaux

Travaux pratiques

Avantages/inconvénients des approches étudiées

  • K-means simple, Graclus, Cluto
  • Algorithme hiérarchique : Louvain
  • InfoMap, Fast Modularity
  • NCut, approche Girvan Newman…
  • Extraction d’arbres couvrants et composition

Travaux pratiques

Déploiement de K-means sur un jeu de données puis implémentation de l’algorithme hiérarchique CAH.

  • Introduction à la performance et à la complexité
  • Mesures de qualité
  • Critères qualité
  • Technique des diagrammes d’Inselberg

Travaux pratiques

Mesure de la qualité sur un jeu de données

  • Présentation du jeu de données
  • Analyse des propriétés du réseau
  • Exécution d’algorithmes de clustering
  • Affichage du résultat
  • Calcul de la qualité des partitionnements effectués

Travaux pratiques :

Mise en œuvre d’algorithmes de clustering sur un réseau lexical et sur des documents Web, pdf…

  • Présentation du jeu de données
  • Analyse des propriétés du réseau
  • Calcul de mesures de similarité
  • Exécution d’algorithmes de clustering
  • Affichage du résultat
  • Calcul de la qualité

Travaux pratiques

Mise en œuvre d’algorithmes de clustering sur une base documentaire, calcul de mesures de similarité, clustering, analyse de la qualité

Équipe pédagogique

Professionnel expert technique et pédagogique

Moyens pédagogiques et techniques

  • Espace intranet de formation.
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Dispositif de suivi

  • Émargement numérique.
  • Mises en situation.
  • Formulaires d’évaluation de la formation.
  • Certificat de réalisation de l’action de formation.

Vous avez une question ?