工程师
其他
持续集成
组织
创新
推荐课程
average > 0 ? $model->average . '分' : '10.0分' ?>

DataOps数据运维实战培训

刘老师

某知名咨询公司 云平台系统架构师

毕业于⼤连理⼯⼤学
简介:
精通开源的⼤数据⽣态技术和架构,Hadoop、Hive、Hbase、 Spark、Flink等开源技术栈。
有10年左右基于⼤数据解决⽅案平台、数据架构、数据中台、数据治理、数据分析和挖掘的⼤型数据湖和数
据中台项⽬架构实施经验,
⽬前任职国内知名咨询公司,先后服务于北京⼤学软件研究所、阿⾥巴巴、Teradata,实施过基于开源⼤数据技术
栈的数据湖解决⽅案和实施、湖仓⼀体架构咨询和实施、数据中台的咨询和设施
最近主要项⽬介绍:
某移动⼤数据平台架构设计和设施 (Hadoop、Spark)
四⼤⾏之⼀的数据湖咨询和实施
某⼤型商业银⾏数据中台咨询
某银⾏基于开源⼤数据技术栈数据中台的咨询和实施
某航空公司数据平台流批⼀体解决⽅案和实施
特长:
在⼤数据架构、开发、运维和优化、数据集成、 数据湖(Data Lake)、数据建模、数据挖掘/机器学习、数据
中台等⽅⾯有丰富经 验。

毕业于⼤连理⼯⼤学 简介: 精通开源的⼤数据⽣态技术和架构,Hadoop、Hive、Hbase、 Spark、Flink等开源技术栈。 有10年左右基于⼤数据解决⽅案平台、数据架构、数据中台、数据治理、数据分析和挖掘的⼤型数据湖和数 据中台项⽬架构实施经验, ⽬前任职国内知名咨询公司,先后服务于北京⼤学软件研究所、阿⾥巴巴、Teradata,实施过基于开源⼤数据技术 栈的数据湖解决⽅案和实施、湖仓⼀体架构咨询和实施、数据中台的咨询和设施 最近主要项⽬介绍: 某移动⼤数据平台架构设计和设施 (Hadoop、Spark) 四⼤⾏之⼀的数据湖咨询和实施 某⼤型商业银⾏数据中台咨询 某银⾏基于开源⼤数据技术栈数据中台的咨询和实施 某航空公司数据平台流批⼀体解决⽅案和实施 特长: 在⼤数据架构、开发、运维和优化、数据集成、 数据湖(Data Lake)、数据建模、数据挖掘/机器学习、数据 中台等⽅⾯有丰富经 验。

课程费用

6800.00 /人

课程时长

2

成为教练

课程简介

DataOps是一种协作数据管理方法,旨在通过自动化和集成提高数据交付速度。它解决了传统数据管道的挑战,如速度慢、数据类型多样性和数据孤岛,从而提高数据生产力和组织对市场变化的响应能力。DataOps强调数据操作化,打破数据孤岛,实现数据的民主化访问,并通过持续集成、交付和部署确保数据在整个组织中的高效流动。这种方法使所有利益相关者能够更快地获取和利用数据,推动业务增长和创新。

目标收益

课程涵盖了 DataOps 领域的各个方面,包括数据流程管理、自动化工具、数据安全与隐私、数据质量保障等等。学员们获得了全面的知识体系,能够应对各种数据运维挑战。
注重理论与实践的结合。通过分析真实案例,学员们不仅理解了概念,还学会了如何在实际工作中应用 DataOps原则。这种实际经验在职业生涯中至关重要。

培训对象

课程大纲

DataOps概念介绍及核心原则 什么是DataOps(数据运维)
DataOps 解决的挑战和问题
DataOps 的业务优势
DataOps 的原则
DataOps 生命周期(开发、测试、部署、监控)
数据流水线(Data Pipeline)的概念
DevOps 对比 DataOps
DataOps 平台的演进
DataOps 对企业的收益
DataOps能力模型框架 "4+3”的能力框架介绍
核心环节:
-研发管理
-交付管理
-数据运维
-价值运营
实践保障:
-组织管理
-系统工具
-安全管控
DataOps实践路径
-战略文化
-组织职能
-流程驱动
-平台建设
持续优化
数据流水线开发与自动化实战 构建可复用的数据流水线
- 模块化设计
- 参数化与配置管理
- 代码示例(Hive SQL + 任务调度工具)
数据版本控制与协作
- Git 基础(分支管理、Pull Request)
- DVC(Data Version Control)实践
- 代码与数据分离策略
自动化测试与数据质量
- 单元测试 vs. 数据测试
- 数据质量检查(Schema 验证、异常检测)
- 工具演示
某大型企业DataOps落地案例深度剖析 多环境(集群)管理
- 数据湖平台
- 数据探索平台
- 实时数据平台
- OLTP数据查询平台
 一站式数据开发工具介绍
数据集成层:多元化数据集成
- 离线数据集成
- 实时数据集成
- Data API数据集成服务
- 多数据源集成能力
- 持续集成、持续监控的能力
- 持续集成任务编排
开发层:数据开发全链路
-模型设计
-数据开发
-部署上线
-质量稽核
研发管理:持续交付和持续部署
- 离线任务开发管理(Hive任务、Spark SQL任务)
- 实时任务开发管理(Kafka+Flink任务)
- 开发任务版本管理、发布、退役等
- 开发任务的全链路权限管理(开发环境、生产环境)
数据运维:全链路数据运维
- 元数据管理
- 全链路数据血缘管理
- 全域血缘打通
- 数据资产分析
- 数据处理链路自动化监控和运维
- 数据开发环境和数据生产环境无感知开发和部署
- 数据分类、数据安全等全链路开发
- 数据全生命周期自动化管理
 标准体系:打造研发治理一体化流水线
- 数据质量、数据标准、数据安全等与数据开发一体化
- 将自动化测试融入数据研发、交付、运维
- 实时 监控数据流水线的运行状态
DataOps四大关键能力
-统一调度编排
-统一监控/告警
- 模型设计
团队协作
DataOps案例分享 中国联通DataOps体系落地案例分享
中国移动DataOps体系落地案例分享
某大型商业银行DataOps体系落地案例分享
DataOps概念介绍及核心原则
什么是DataOps(数据运维)
DataOps 解决的挑战和问题
DataOps 的业务优势
DataOps 的原则
DataOps 生命周期(开发、测试、部署、监控)
数据流水线(Data Pipeline)的概念
DevOps 对比 DataOps
DataOps 平台的演进
DataOps 对企业的收益
DataOps能力模型框架
"4+3”的能力框架介绍
核心环节:
-研发管理
-交付管理
-数据运维
-价值运营
实践保障:
-组织管理
-系统工具
-安全管控
DataOps实践路径
-战略文化
-组织职能
-流程驱动
-平台建设
持续优化
数据流水线开发与自动化实战
构建可复用的数据流水线
- 模块化设计
- 参数化与配置管理
- 代码示例(Hive SQL + 任务调度工具)
数据版本控制与协作
- Git 基础(分支管理、Pull Request)
- DVC(Data Version Control)实践
- 代码与数据分离策略
自动化测试与数据质量
- 单元测试 vs. 数据测试
- 数据质量检查(Schema 验证、异常检测)
- 工具演示
某大型企业DataOps落地案例深度剖析
多环境(集群)管理
- 数据湖平台
- 数据探索平台
- 实时数据平台
- OLTP数据查询平台
 一站式数据开发工具介绍
数据集成层:多元化数据集成
- 离线数据集成
- 实时数据集成
- Data API数据集成服务
- 多数据源集成能力
- 持续集成、持续监控的能力
- 持续集成任务编排
开发层:数据开发全链路
-模型设计
-数据开发
-部署上线
-质量稽核
研发管理:持续交付和持续部署
- 离线任务开发管理(Hive任务、Spark SQL任务)
- 实时任务开发管理(Kafka+Flink任务)
- 开发任务版本管理、发布、退役等
- 开发任务的全链路权限管理(开发环境、生产环境)
数据运维:全链路数据运维
- 元数据管理
- 全链路数据血缘管理
- 全域血缘打通
- 数据资产分析
- 数据处理链路自动化监控和运维
- 数据开发环境和数据生产环境无感知开发和部署
- 数据分类、数据安全等全链路开发
- 数据全生命周期自动化管理
 标准体系:打造研发治理一体化流水线
- 数据质量、数据标准、数据安全等与数据开发一体化
- 将自动化测试融入数据研发、交付、运维
- 实时 监控数据流水线的运行状态
DataOps四大关键能力
-统一调度编排
-统一监控/告警
- 模型设计
团队协作
DataOps案例分享
中国联通DataOps体系落地案例分享
中国移动DataOps体系落地案例分享
某大型商业银行DataOps体系落地案例分享

活动详情

提交需求