课程简介
面对大规模用户突发请求,而在系统达到瓶颈时无法快速扩容?一个新功能上线从测试到正式上线可能 需要经历数十小时甚至高达数周时间?一次服务器上线、重装、配置服务都需要经历漫长的等待?如果业务需要一次性上线几百台服务器,该怎么办?传统企业又要如何开展自动化运维?团队如何组成?如果提升团队效率? 有效解决以上难题是一个系统工程,因此,课程中介绍的每个系统、每个系统所运用的技术、以及每个工具背后都是大量项目实践的总结,都有讲师亲身经历的“自动化运维故事”。
目标收益
1. 何谓运维自动化?自动化都解决哪些问题?互联网又有哪些经典案例?
2. IT基础设施云化,IaaS/PaaS/SaaS对传统的冲击又有哪些?
3. 大规模集群与业务快速增长时,如果有效地保证质量的同时,提升效率呢?
4. 运维大数据的运用与大数据平台目标与差异在哪里?
5. 系统安装->初始化->配置管理->应用变更更->命令执行->监控,如何串联?
6. 如何建设可持续发展的运维平台
培训对象
高级程序员、系统架构师、系统管理员、运维工程师、运维架构师、项目经理以及其他具有与运维相关的人员。
课程大纲
第一天:了解背景,学习整体架构 |
上午: ●传统运维工作人员所面临的挑战 ●自动化运维整体架构 ○整体架构设计 ○运维的架构思想 ○逐步实践的思路 ○相关系统及功能介绍/设计思路 ●DevOps及SRE概念厘清 ○什么是DevOps ○什么是SRE ○不同企业适合哪种场景 下午: ●案例分享:新浪、百度、金山的几个案例 ○实战案例分析 ■新浪(CDN自动化运维) ■百度(CI的运用及架构梳理) ■金山(整体平台的构建思路) ○整体架构的最佳实践 |
第二天 |
上午:运维工具普及、数据化运维的重要性 ●专题:运维工具 ○介绍常见自动化运维工具,并对各子领域的同类工具做对比性介绍。 ○专题还将介绍自主研发和开源产品二次开发两种选择的区别和时机选择。 ●专题:ELK ○介绍ELK的架构 ○使用案例,如何利用ELK快速定位与排查故障 下午:不容忽视的团队建设 ●人才的培养 ○团队建设 ○云运维的差异 ○运维安全浅谈 ●标准与可持续发展 ○标准的演变过程 ○简单可评估原则 |
第一天:了解背景,学习整体架构 上午: ●传统运维工作人员所面临的挑战 ●自动化运维整体架构 ○整体架构设计 ○运维的架构思想 ○逐步实践的思路 ○相关系统及功能介绍/设计思路 ●DevOps及SRE概念厘清 ○什么是DevOps ○什么是SRE ○不同企业适合哪种场景 下午: ●案例分享:新浪、百度、金山的几个案例 ○实战案例分析 ■新浪(CDN自动化运维) ■百度(CI的运用及架构梳理) ■金山(整体平台的构建思路) ○整体架构的最佳实践 |
第二天 上午:运维工具普及、数据化运维的重要性 ●专题:运维工具 ○介绍常见自动化运维工具,并对各子领域的同类工具做对比性介绍。 ○专题还将介绍自主研发和开源产品二次开发两种选择的区别和时机选择。 ●专题:ELK ○介绍ELK的架构 ○使用案例,如何利用ELK快速定位与排查故障 下午:不容忽视的团队建设 ●人才的培养 ○团队建设 ○云运维的差异 ○运维安全浅谈 ●标准与可持续发展 ○标准的演变过程 ○简单可评估原则 |