Aperçu du cours
Introduction au Big Data
Commencez par découvrir ce qu’est le Big Data et son importance dans le monde actuel. Apprenez comment Python est devenu un outil clé pour le traitement et l’analyse du Big Data grâce à sa simplicité et à sa puissance.
Python et les Librairies pour le Big Data
Explorez les librairies Python essentielles pour travailler avec le Big Data, telles que Pandas pour la manipulation de données, PySpark pour le traitement de données à grande échelle, et Dask pour le calcul parallèle.
Traitement et Analyse de Données Massives
Découvrez comment traiter des volumes massifs de données de manière efficace. Ce module couvre les techniques de traitement de données, l’analyse exploratoire, et la visualisation pour tirer des insights concrets des ensembles de données volumineux.
Machine Learning avec Python
Apprenez à appliquer des techniques de machine learning pour analyser et prédire à partir de grandes quantités de données. Utilisez des librairies comme Scikit-Learn et TensorFlow pour construire et entraîner des modèles prédictifs.
Projets Pratiques sur le Big Data
Mettez en pratique vos compétences en travaillant sur des projets réels de Big Data. Ces projets vous permettront de solidifier vos connaissances et de préparer des applications industrielles, en utilisant Python pour résoudre des problèmes complexes.
Prérequis
- Maîtrise de la programmation Python et connaissances de base en statistiques
Objectifs pédagogiques
- Comprendre le principe de la modélisation statistique
- Savoir utiliser les principaux outils de traitement et d'analyse de données pour Python
- Être capable d'extraire des données d'un fichier
- Savoir appliquer les pratiques optimales en matière de nettoyage et de préparation des données avant l'analyse
- Apprendre à mettre en place un modèle d'apprentissage simple
- Choisir entre la régression et la classification en fonction du type de données
- Évaluer les performances prédictives d'un algorithme
- Créer des sélections et des classements dans de grands volumes de données pour dégager des tendances
Public ciblé
- Développeurs en Python
- Responsables Infocentre
- Développeurs de logiciels
- Programmeurs
- Data analysts
- Data scientists
Programme de formation
-
Présentation de Python
-
Les forces & faiblesses Python pour la data
-
Outils liés à Python
-
-
Présentation de Python
-
Les forces & faiblesses Python pour la data
-
Outils liés à Python
-
-
Présentation de Python
-
Les forces & faiblesses Python pour la data
-
Outils liés à Python
-
-
Présentation de Python
-
Les forces & faiblesses Python pour la data
-
Outils liés à Python
-
-
Présentation de Python
-
Les forces & faiblesses Python pour la data
-
Outils liés à Python
-
-
Présentation de Python
-
Les forces & faiblesses Python pour la data
-
Outils liés à Python
-
-
Présentation de Python
-
Les forces & faiblesses Python pour la data
-
Outils liés à Python
-
-
Calculs & graphiques
-
Présentation de NumPy
-
Présentation de SciPy
-
Utilisation de tableaux & fonctions mathématiques
-
basemap & matplotlib : représentation graphique
-
Manipulation de NumPy & SciPy
-
-
Calculs & graphiques
-
Présentation de NumPy
-
Présentation de SciPy
-
Utilisation de tableaux & fonctions mathématiques
-
basemap & matplotlib : représentation graphique
-
Manipulation de NumPy & SciPy
-
-
Calculs & graphiques
-
Présentation de NumPy
-
Présentation de SciPy
-
Utilisation de tableaux & fonctions mathématiques
-
basemap & matplotlib : représentation graphique
-
Manipulation de NumPy & SciPy
-
-
Calculs & graphiques
-
Présentation de NumPy
-
Présentation de SciPy
-
Utilisation de tableaux & fonctions mathématiques
-
basemap & matplotlib : représentation graphique
-
Manipulation de NumPy & SciPy
-
-
Calculs & graphiques
-
Présentation de NumPy
-
Présentation de SciPy
-
Utilisation de tableaux & fonctions mathématiques
-
basemap & matplotlib : représentation graphique
-
Manipulation de NumPy & SciPy
-
-
Calculs & graphiques
-
Présentation de NumPy
-
Présentation de SciPy
-
Utilisation de tableaux & fonctions mathématiques
-
basemap & matplotlib : représentation graphique
-
Manipulation de NumPy & SciPy
-
-
Calculs & graphiques
-
Présentation de NumPy
-
Présentation de SciPy
-
Utilisation de tableaux & fonctions mathématiques
-
basemap & matplotlib : représentation graphique
-
Manipulation de NumPy & SciPy
-
-
Données relationnelles
-
Manipulation de tables de données
-
Tableaux avec pandas
-
Stockage dans des fichiers
-
Comparatif Pandas / NumPy : forces & faiblesses, cas d’usages
-
-
Données relationnelles
-
Manipulation de tables de données
-
Tableaux avec pandas
-
Stockage dans des fichiers
-
Comparatif Pandas / NumPy : forces & faiblesses, cas d’usages
-
-
Données relationnelles
-
Manipulation de tables de données
-
Tableaux avec pandas
-
Stockage dans des fichiers
-
Comparatif Pandas / NumPy : forces & faiblesses, cas d’usages
-
-
Données relationnelles
-
Manipulation de tables de données
-
Tableaux avec pandas
-
Stockage dans des fichiers
-
Comparatif Pandas / NumPy : forces & faiblesses, cas d’usages
-
-
Données relationnelles
-
Manipulation de tables de données
-
Tableaux avec pandas
-
Stockage dans des fichiers
-
Comparatif Pandas / NumPy : forces & faiblesses, cas d’usages
-
-
Données relationnelles
-
Manipulation de tables de données
-
Tableaux avec pandas
-
Stockage dans des fichiers
-
Comparatif Pandas / NumPy : forces & faiblesses, cas d’usages
-
-
Données relationnelles
-
Manipulation de tables de données
-
Tableaux avec pandas
-
Stockage dans des fichiers
-
Comparatif Pandas / NumPy : forces & faiblesses, cas d’usages
-
-
Utilisation de Python pour le machine learning & le deep learning
-
Tour d’horizon des outils
-
Focus sur Tensorflow
-
APIs fournies en standard
-
Modèles d’apprentissage
-
Scikit-learn : initiation et comparatif
-
-
Utilisation de Python pour le machine learning & le deep learning
-
Tour d’horizon des outils
-
Focus sur Tensorflow
-
APIs fournies en standard
-
Modèles d’apprentissage
-
Scikit-learn : initiation et comparatif
-
-
Utilisation de Python pour le machine learning & le deep learning
-
Tour d’horizon des outils
-
Focus sur Tensorflow
-
APIs fournies en standard
-
Modèles d’apprentissage
-