Aperçu du cours
Objectifs de formation : à l’issue de la formation, le stagiaire sera capable de réaliser une analyse statistique avec le logiciel R et d’en restituer les résultats sous forme graphique.
Prérequis
- Être familier avec l'environnement Microsoft Windows
- Avoir des connaissances de base en statistique & en mathématique
Objectifs pédagogiques
- Savoir installer et utiliser l’environnement d'analyse R
- Comprendre comment manipuler des données avec R
- Savoir importer et exporter des données
- Savoir reconnaître les différents types d'objets de R
- Créer des programmes d'analyse avec R
- Être en mesure de réaliser des analyses statistiques basiques avec R
- Savoir restituer des résultats à l'aide de graphiques
Public ciblé
- Data analysts
- Statisticiens
- Développeurs en environnement statistique
- Toute personne intéressée par l'analyse statistique avec R
Programme de formation
-
Présentation du logiciel
-
Définition & historique
-
Forces & faiblesses
-
Tour d’horizon des logiciels concurrents
-
-
Premiers pas
-
Installation du logiciel
-
Présentation de l’environnement de développement
-
Historique des commandes
-
Environnement superposé
-
-
Mise en oeuvre
-
Console de commande
-
Aide & langue
-
Ligne de commande principales
-
Sauvegarde
-
-
Utilisation de packages
-
Installation, désinstallation & mise à jour des packages
-
Obtention des informations systèmes
-
Rédaction de commandes multiples
-
Ajout de commentaires
-
-
Types de données
-
Présentation des méthodes pour manipuler les principaux types de données
-
Création / Modification de données en ligne de commande
-
Gestion des variables dans la mémoire
-
-
Importation & exportation
-
Import/Export des données sous différents formats & vers différentes destinations : CSV, XML, JSON, MySQL, Oracle, Web…
-
-
Manipulation de données
-
Utilisation de SQL
-
Présentation de différents Data set
-
Manipulation des data frames
-
Rangs
-
Tri & filtres des données
-
Création de sous-sélections
-
Fusion de données
-
Suppression des doublons
-
Échantillonnage
-
Empiler/Désempiler des données
-
-
Analyse de données
-
Synthétiser des données (tables de contingence)
-
Travailler avec des valeurs absentes
-
Définir le nombre de décimales de chaque sortie
-
Générer des variables pseudo-aléatoires
-
Statistiques descriptives simples (comptage, éléments uniques, moyenne, max, min, centiles, somme, écart-type biaisé/non biaisé, cv, médiane, etc.)
-
Plotter (tracer) des fonctions algébriques
-
Racines d’équations univariées
-
Intégration numérique
-
Intégration algébrique
-
Dérivation algébrique/numérique
-
Optimisation linéaire uni ou multidimensionnelle
-
Optimisation sous contrainte
-
Programmation linéaire
-