Aperçu du cours
Objectif de formation: Cette formation avancée sur Pandas vise à fournir aux participants une compréhension approfondie des fonctionnalités avancées de la bibliothèque Pandas en Python pour la manipulation et l’analyse de données. Les participants apprendront des techniques avancées pour explorer, nettoyer, transformer et analyser des données complexes à l’aide de Pandas.
Prérequis
- Une connaissance de base de la bibliothèque Pandas et des concepts fondamentaux de la manipulation de données est requise
Objectifs pédagogiques
- Maîtriser les techniques avancées de manipulation de données avec Pandas
- Nettoyer et préparer efficacement les données pour l'analyse
- Réaliser des analyses statistiques et des visualisations avancées avec Pandas
- Exploiter les fonctionnalités avancées de Pandas pour des tâches spécifiques
- Acquérir une compréhension approfondie de l'utilisation de Pandas dans des scénarios complexes
Public ciblé
- analystes de données
- scientifiques des données
- développeurs Python
- professionnels de la business intelligence
- toute personne travaillant avec des données et souhaitant approfondir ses compétences en manipulation et en analyse de données avec Pandas
Programme de formation
-
Manipulation avancée de données avec Pandas (4 heures)
-
Manipulation de données multidimensionnelles avec les DataFrames
-
Utilisation des opérations de filtrage, de tri et de regroupement
-
Les techniques avancées de jointure et de fusion de données
-
Travaux pratiques : Manipulation de données complexes à l’aide de Pandas
-
-
Nettoyage et préparation de données avec Pandas (4 heures)
-
Gestion des valeurs manquantes et des données aberrantes
-
Traitement des doublons et des données incohérentes
-
Normalisation et transformation des données
-
Travaux pratiques : Nettoyage et préparation de jeux de données réels
-
-
Analyse et visualisation avancées avec Pandas (4 heures)
-
Calcul des statistiques descriptives et des agrégations de données
-
Utilisation des fonctions de fenêtrage et de rolling
-
Création de visualisations avancées avec Pandas et Matplotlib
-
Travaux pratiques : Analyse et visualisation de jeux de données complexes
-
-
Fonctionnalités avancées de Pandas (2 heures)
-
Utilisation des index et des séries temporelles
-
Application de transformations avancées sur les données
-
Exploitation des capacités de parallélisation avec Pandas
-
Travaux pratiques : Exploration des fonctionnalités avancées de Pandas
-