Détails
- 5 Sections
- 22 Lessons
- 35 heures
Expand all sectionsCollapse all sections
- Introduction à l'Ingénierie de Fiabilité des Services (6 heures)4
- 1.1Présentation de l’ingénierie de fiabilité des services (SRE) et son rôle dans la gestion des services informatiques
- 1.2Principes fondamentaux de SRE et différences par rapport aux autres approches
- 1.3Conception de services résilients et évolutifs
- 1.4Exercices pratiques et études de cas pour renforcer la compréhension des concepts : étude de cas basée sur l’approche SRE de Google pour résoudre un problème réel.
- Surveillance et Gestion des Incidents (7 heures)5
- 2.1Méthodes et outils de surveillance des services
- 2.2Collecte, analyse et interprétation des données de surveillance
- 2.3Prévention et gestion des incidents
- 2.4Travaux pratiques : les participants configureront des outils de surveillance tels que des systèmes de suivi des métriques et des journaux. Ils créeront des tableaux de bord pour visualiser les métriques clés et configureront des alertes en cas de seuils dépassés.
- 2.5Travaux pratiques : les participants participeront à une simulation d’incident où ils devront détecter, analyser et résoudre un problème dans un environnement simulé. Ils appliqueront les principes de SRE pour gérer efficacement l’incident et minimiser l’impact sur le service
- Résolution de Problèmes et Optimisation des Performances (7 heures)5
- 3.1Méthodologie de résolution de problèmes en utilisant l’approche SRE
- 3.2Identification et résolution des goulots d’étranglement
- 3.3Mesure et amélioration des performances des services
- 3.4Exercices pratiques de résolution de problèmes et d’optimisation des performances
- 3.5Travaux pratiques : Les participants mettront en œuvre des optimisations de performances dans un environnement simulé. Ils mesureront les améliorations obtenues et évalueront l’impact sur la fiabilité et la disponibilité du service.
- Déploiement et Mise à l'Échelle des Services (7 heures)5
- 4.1Stratégies de déploiement pour assurer la disponibilité continue des services
- 4.2Gestion de la mise à l’échelle pour répondre à la demande croissante
- 4.3Méthodes de gestion des changements et des mises à jour
- 4.4Exercices pratiques de déploiement et de mise à l’échelle
- 4.5Gestion de la mise à l’échelle : Les participants simuleront une augmentation de la charge sur un service et mettront en œuvre des stratégies de mise à l’échelle pour répondre à cette demande croissante. Ils surveilleront les métriques de performance et ajusteront les ressources en conséquence.
- Bonnes Pratiques de SRE et Études de Cas (8 heures)3
- 5.1Bonnes pratiques de SRE pour assurer la fiabilité des services à long terme
- 5.2Études de cas basées sur des exemples réels de Google
- 5.3Études de cas Google SRE : Les participants examineront plusieurs études de cas basées sur les pratiques de SRE chez Google. Ils analyseront les approches et les solutions mises en œuvre pour résoudre des problèmes complexes de fiabilité des services.
Prévention et gestion des incidents
Préc.
Travaux pratiques : les participants participeront à une simulation d’incident où ils devront détecter, analyser et résoudre un problème dans un environnement simulé. Ils appliqueront les principes de SRE pour gérer efficacement l’incident et minimiser l’impact sur le service
Suivant