Support & Downloads

Quisque actraqum nunc no dolor sit ametaugue dolor. Lorem ipsum dolor sit amet, consyect etur adipiscing elit.

s f

Contact Info
198 West 21th Street, Suite 721
New York, NY 10010
youremail@yourdomain.com
+88 (0) 101 0000 000
Follow Us

Python - Extraction des données, scrapping & growth hacking

réf : BDT-PE

Objectifs pédagogiques

  • Maîtriser le scrapping de données
  • Réaliser les actions d’ingestion pour alimenter un Data Lake

Pré-requis

Maîtriser les bases du langage Python 

Avoir des connaissances en algorithmique

Public concerné

Développeur, intégrateurs, chefs de projets, consultants…

Programme

  • Les éléments fondamentaux du langage
  • Les apports et enjeux de Python dans la Big Data et l’analyse de données
  • Les différents types de bases
  • Les procédures et fonctions
  • Pandas : présentation de la librairie
  • Manipuler les données avec cette librairie
  • Définition du concept de DataFrame
  • Les structures d’interrogation et d’indexation
  • Les données manquantes et leur traitement
  • La fusion de DataFrame
  • Manipuler les dates
  • Appliquer des mesures statistiques variées sur les DataFrames
  • Les problèmes de mesure et de normalisation
  • Réaliser des métriques d’analyse
  • Définition du scrapping
  • Le niveau de difficulté du scrapping selon le support
    • Web
    • Papier
    • PDF
  • Les usages pratiques du scrapping
  • L’architecture d’internet
  • Définition d’un « Client »
  • Définition d’un « Serveur »
  • L’importance des deux notions
  • L’impact du HTTP et du HTML sur les scrapers
  • La balise HTML et son attribut
  • L’identification d’éléments par « class » et par « id »
  • Les formats de données structurées
    • CSV
    • XML
    • JSON
  • Lecture et écriture des fichiers
  • Exploiter les données de fichiers de différentes sources
  • Les fonctions d’accès
  • Chargement des données en blocs de lignes
  • Beautiful Soup & CSS Select : les outils dédiés au scrapping
  • Les scrapers simples
  • Élaborer une stratégie pour naviguer sur le site
  • Le codage du scraper
  • Les scrapers complexes : l’envoi de données à un site internet
  • Les requêtes POST et les requêtes GET
  • Parcourir un site pour trouver des données
  • Élaborer une stratégie
  • Le codage du scraper complexes 

Équipe pédagogique

Professionnel expert dans le Big Data

Moyens pédagogiques et techniques

  • Espace intranet de formation.
  • Documents supports de formation projetés.
  • Exposés théoriques
  • Étude de cas concrets
  • Mise à disposition en ligne de documents supports à la suite de la formation.

Dispositif de suivi

  • Émargement numérique.
  • Mises en situation.
  • Formulaires d’évaluation de la formation.
  • Certificat de réalisation de l’action de formation.

Vous avez une question ?