课程简介
这是一门专为IT专业人士设计的实战课程。课程深入探讨SRE的核心理念,详解实践流程,并通过实战演练和案例研讨,让你在理论与实践中找到平衡,全面提升SRE能力。无论你是DevOps工程师,还是想进阶成为SRE,本课程都能为你提供宝贵的学习机会。
目标收益
1、在组织中对SRE相关的基础理念、核心实践达成高度一致和认同
2、彻底梳理SRE的知识体系的五大核心基础和相互之间的关系
3、对SRE的实施过程和相关案例做针对性的研讨
4、详细理解在组织中制定SLO的流程和实施方式
培训对象
1、DevOps工程师、运维工程师、软件工程师
2、想成为SRE/DevOps工程师的人员
3、服务交付经理、项目经理、产品经理
4、已经有ITIL/DevOps或敏捷相关认证的人员
课程大纲
模块 1: SRE 概述 |
1.SRE 的定义和来历 2.探究SRE的发展历程和其在IT领域的演变。 3.分析SRE与DevOps之间的密切关系。 4.介绍SRE管理的核心体系。 |
模块 2: SRE 的核心基础 |
1.SRE的五大核心基础 2.深入理解SRE的核心概念,重点关注SLO的实际应用。 3.实践中探讨SRE在监控告警方面的应用,突破与传统运维管理的区别。 4.探讨如何通过消除琐事和简化系统,摆脱繁琐的人工运维。 |
模块 3: SRE 的实践和流程 |
1.SRE的实践和流程详解 2.深度解析SRE的九大实践,包括具体操作和案例研究。 3.探讨SRE的五大特征,并对比其与ITIL流程的不同之处。 4.分析实际的SRE参考案例,提供深入的研讨和实际应用的机会。 |
模块 4: 工作坊 -《SLO兵法》实施 SRE 艺术 |
1.引入SLO的实际工作坊,加深对运用核心概念的理解。 2.回顾SRE的核心概念,为深入的SLO实践打下基础。 3.定制SLO和SLI流程,包括用户旅程和系统边界的法则。 4.分组进行实际的SLO实战演练,加强团队合作和实际应用的能力。 |
模块 5: 云原生环境下的非抽象大系统设计 |
1.合理运用云基础设施的特性对业务系统进行设计与规划 2.深入探讨抽象系统设计和非抽象设计的概念。 3.讨论大规模业务系统的规划,强调设计决策对系统稳定性的影响。 4.探讨分布式架构和可恢复系统的设计原则。 5.结合课堂练习对设计概念进行实际运用,并进行综合总结。 |
模块 6: 综合答疑&总结 | 回答学员提出的问题,深化对课程内容的理解,并进行全面总结,确保学员能够充分领会并应用所学的关键概念。 |
模块 1: SRE 概述 1.SRE 的定义和来历 2.探究SRE的发展历程和其在IT领域的演变。 3.分析SRE与DevOps之间的密切关系。 4.介绍SRE管理的核心体系。 |
模块 2: SRE 的核心基础 1.SRE的五大核心基础 2.深入理解SRE的核心概念,重点关注SLO的实际应用。 3.实践中探讨SRE在监控告警方面的应用,突破与传统运维管理的区别。 4.探讨如何通过消除琐事和简化系统,摆脱繁琐的人工运维。 |
模块 3: SRE 的实践和流程 1.SRE的实践和流程详解 2.深度解析SRE的九大实践,包括具体操作和案例研究。 3.探讨SRE的五大特征,并对比其与ITIL流程的不同之处。 4.分析实际的SRE参考案例,提供深入的研讨和实际应用的机会。 |
模块 4: 工作坊 -《SLO兵法》实施 SRE 艺术 1.引入SLO的实际工作坊,加深对运用核心概念的理解。 2.回顾SRE的核心概念,为深入的SLO实践打下基础。 3.定制SLO和SLI流程,包括用户旅程和系统边界的法则。 4.分组进行实际的SLO实战演练,加强团队合作和实际应用的能力。 |
模块 5: 云原生环境下的非抽象大系统设计 1.合理运用云基础设施的特性对业务系统进行设计与规划 2.深入探讨抽象系统设计和非抽象设计的概念。 3.讨论大规模业务系统的规划,强调设计决策对系统稳定性的影响。 4.探讨分布式架构和可恢复系统的设计原则。 5.结合课堂练习对设计概念进行实际运用,并进行综合总结。 |
模块 6: 综合答疑&总结 回答学员提出的问题,深化对课程内容的理解,并进行全面总结,确保学员能够充分领会并应用所学的关键概念。 |