工程师
其他
大数据
运维
Spark
大数据平台
推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

大数据平台运维和优化实战培训

刘老师

某知名咨询公司 云平台系统架构师

毕业于⼤连理⼯⼤学
简介:
精通开源的⼤数据⽣态技术和架构,Hadoop、Hive、Hbase、 Spark、Flink等开源技术栈。
有10年左右基于⼤数据解决⽅案平台、数据架构、数据中台、数据治理、数据分析和挖掘的⼤型数据湖和数
据中台项⽬架构实施经验,
⽬前任职国内知名咨询公司,先后服务于北京⼤学软件研究所、阿⾥巴巴、Teradata,实施过基于开源⼤数据技术
栈的数据湖解决⽅案和实施、湖仓⼀体架构咨询和实施、数据中台的咨询和设施
最近主要项⽬介绍:
某移动⼤数据平台架构设计和设施 (Hadoop、Spark)
四⼤⾏之⼀的数据湖咨询和实施
某⼤型商业银⾏数据中台咨询
某银⾏基于开源⼤数据技术栈数据中台的咨询和实施
某航空公司数据平台流批⼀体解决⽅案和实施
特长:
在⼤数据架构、开发、运维和优化、数据集成、 数据湖(Data Lake)、数据建模、数据挖掘/机器学习、数据
中台等⽅⾯有丰富经 验。

毕业于⼤连理⼯⼤学 简介: 精通开源的⼤数据⽣态技术和架构,Hadoop、Hive、Hbase、 Spark、Flink等开源技术栈。 有10年左右基于⼤数据解决⽅案平台、数据架构、数据中台、数据治理、数据分析和挖掘的⼤型数据湖和数 据中台项⽬架构实施经验, ⽬前任职国内知名咨询公司,先后服务于北京⼤学软件研究所、阿⾥巴巴、Teradata,实施过基于开源⼤数据技术 栈的数据湖解决⽅案和实施、湖仓⼀体架构咨询和实施、数据中台的咨询和设施 最近主要项⽬介绍: 某移动⼤数据平台架构设计和设施 (Hadoop、Spark) 四⼤⾏之⼀的数据湖咨询和实施 某⼤型商业银⾏数据中台咨询 某银⾏基于开源⼤数据技术栈数据中台的咨询和实施 某航空公司数据平台流批⼀体解决⽅案和实施 特长: 在⼤数据架构、开发、运维和优化、数据集成、 数据湖(Data Lake)、数据建模、数据挖掘/机器学习、数据 中台等⽅⾯有丰富经 验。

课程费用

6800.00 /人

课程时长

4

成为教练

课程简介

1.掌握基于大数据平台核心组件(HDFS、Yarn、Hive、Hbase、Spark和Flink等)的搭建、使用、运维
2.掌握大数据使用场景和性能优化
3.能够掌握700+节点集群的运维和优化
4.掌握大数据平台性能优化的思路,同时能够对Spark、Flink和Hive组件进行性能优化
5.能够对大数据平台组件出现的问题进行有条不紊的分析和解决

目标收益

培训对象

1.大数据开发工程师
2.大数据架构师
3.大数据运维工程师
4.对大数据开发感兴趣的一线开发人员

课程大纲

Day1
大数据集群搭建实战(1小时)
Master节点角色部署实战
Slave节点角色部署实战
工具节点角色部署实战
Edge节点角色部署实战
不同角色节点配置建议(内存、磁盘和CPU)
不同服务磁盘使用规划实战(DN、NN、JN和ZK等)
小于100节点大数据集群角色部署实战
100-200节点大数据集群角色部署实战
大于300节点大数据集群角色部署实战
Hive服务HMS和HS2高可用和loadbalance部署实战
大数据平台权限认证和授权解决方案(LDAP+SSSD+Kerberos+Ranger)
Day1
HDFS原理介绍(1小时)
HDFS架构介绍
HDFS运行原理介绍
NameNode功能详解
DataNode功能详
HDFS HA功能详解
HSFD的fsimage和editslog详解
HDFS的block详解
HDFS的block的备份策略
Day1
HDFS运维和优化(3小时)
机架感知对性能的提升
HDFS+Ranger权限控制运维
Small Files and Java Heap Tuning
HDFS集群通过文件书和block数来估算NN的内存使用和性能瓶颈
元数据FSImage和Edit文件的工作原理和合并机制解析
NN RPC processing is too long
生产环境NN active 和 Standby切换失败,导致集群瘫痪
DN日志出现大量"Slow.*?(took|cost)"问题诊断
Namenode checkpoint status again
Disk Slowness问题排查
Slow LDAP通过日志观察常见的现象
HDFS服务最佳实践
— number of DataNodes,
— Amount of data,
— number of blocks & files,
— number of snapshots,
— number of RPCs per second,
Other limits
Day1
Yarn运维和优化(2小时)
Yarn架构和原理
ResourceManager工作原理
NodeManager工作原理
ApplicationMaster工作原理
Yarn的资源控制机制
Yarn资源封装Container介绍
Yarn资源都租户配置和实战
Yarn replacement rules权限配置和实操
Yarn 队列+Ranger控制详解和实操
Yarn Container资源最大最小设置
Yarn Queue核心参数解释和优化,提升资源使用效率
MapReduce配置参数设置和优化
Yarn任务调度策略CS和FA深度比较
Yarn核心参数解释和优化实战
Day1
大数据集群搭建实战(1小时)
Master节点角色部署实战
Slave节点角色部署实战
工具节点角色部署实战
Edge节点角色部署实战
不同角色节点配置建议(内存、磁盘和CPU)
不同服务磁盘使用规划实战(DN、NN、JN和ZK等)
小于100节点大数据集群角色部署实战
100-200节点大数据集群角色部署实战
大于300节点大数据集群角色部署实战
Hive服务HMS和HS2高可用和loadbalance部署实战
大数据平台权限认证和授权解决方案(LDAP+SSSD+Kerberos+Ranger)
Day1
HDFS原理介绍(1小时)

HDFS架构介绍
HDFS运行原理介绍
NameNode功能详解
DataNode功能详
HDFS HA功能详解
HSFD的fsimage和editslog详解
HDFS的block详解
HDFS的block的备份策略
Day1
HDFS运维和优化(3小时)
机架感知对性能的提升
HDFS+Ranger权限控制运维
Small Files and Java Heap Tuning
HDFS集群通过文件书和block数来估算NN的内存使用和性能瓶颈
元数据FSImage和Edit文件的工作原理和合并机制解析
NN RPC processing is too long
生产环境NN active 和 Standby切换失败,导致集群瘫痪
DN日志出现大量"Slow.*?(took|cost)"问题诊断
Namenode checkpoint status again
Disk Slowness问题排查
Slow LDAP通过日志观察常见的现象
HDFS服务最佳实践
— number of DataNodes,
— Amount of data,
— number of blocks & files,
— number of snapshots,
— number of RPCs per second,
Other limits
Day1
Yarn运维和优化(2小时)
Yarn架构和原理
ResourceManager工作原理
NodeManager工作原理
ApplicationMaster工作原理
Yarn的资源控制机制
Yarn资源封装Container介绍
Yarn资源都租户配置和实战
Yarn replacement rules权限配置和实操
Yarn 队列+Ranger控制详解和实操
Yarn Container资源最大最小设置
Yarn Queue核心参数解释和优化,提升资源使用效率
MapReduce配置参数设置和优化
Yarn任务调度策略CS和FA深度比较
Yarn核心参数解释和优化实战

课程费用

6800.00 /人

课程时长

4

预约体验票 我要分享

近期公开课推荐

近期公开课推荐

活动详情

提交需求