实时数据分析：构建响应迅速的智能决策系统-精品课程-软件研发管理培训、咨询服务-MSUP

课程简介

理解实时数据分析的核心概念、架构和优势。
掌握主流流计算引擎（Apache Flink、Apache Kafka Streams）的使用方法。
掌握 StarRocks 实时数据库的设计和应用。
学习使用窗口函数和复杂事件处理（CEP）技术进行高级实时分析。
了解实时数据分析的应用场景和最佳实践。
能够构建自己的实时数据分析原型系统。

目标收益

培训对象

数据工程师、流计算工程师、数据分析师、数据科学家、以及对实时数据处理感兴趣的技术人员。

课程大纲

第一天：实时数据分析基础与流计算引擎模块 1：实时数据分析概述 (上午)	实时数据的定义、特点和应用场景传统数据分析与实时数据分析的对比实时数据分析的价值与挑战实时数据分析的架构与核心组件：数据源、流计算引擎、存储系统、可视化工具
模块 2：流计算引擎基础 (上午)	流计算引擎的定义与特点有状态计算与无状态计算 Exactly-Once语义与容错机制窗口函数 (Windowing) 的概念与类型：滚动窗口、滑动窗口、会话窗口水印 (Watermark) 的作用：处理乱序数据和延迟数据
模块 3：Apache Flink技术详解 (下午)	Apache Flink的架构与核心组件：DataStream API, Table API, CEP Flink的数据模型：Stream, DataSet, Table Flink的窗口函数：Time-based Windows, Count-based Windows, Session Windows Flink的容错机制：Checkpoint, Savepoint 动手实践：使用Flink DataStream API构建简单的流式数据处理程序
模块 4：Apache Kafka Streams技术详解 (下午)	Apache Kafka Streams的架构与核心组件：Topology, Processor, State Store Kafka Streams的数据模型：KStream, KTable, GlobalKTable Kafka Streams的窗口函数：Time Windows, Session Windows, Hopping Windows Kafka Streams的容错机制：Changelog Topic 动手实践：使用Kafka Streams构建简单的流式数据处理程序
第二天：StarRocks 实时数据库与高级分析技术模块 5：StarRocks技术详解 (上午)	StarRocks的架构与核心组件：FE, BE StarRocks的数据模型：Table, Partition, Segment StarRocks的查询语言：SQL StarRocks的索引技术：Bitmap Index, Inverted Index, Prefix Index StarRocks的存储引擎：列式存储引擎动手实践：使用StarRocks存储和查询实时数据
模块 6：StarRocks的性能优化与管理 (上午)	StarRocks的数据导入方式：Stream Load, Broker Load, Routine Load StarRocks的查询优化：查询重写, 索引选择, 执行计划 StarRocks的集群管理：扩容, 缩容, 故障恢复 StarRocks的监控与报警动手实践：对StarRocks进行性能调优
模块 7：复杂事件处理 (CEP) 技术 (下午)	CEP的定义与应用场景 CEP的模式语言：定义事件模式、条件、时间约束 CEP的常用引擎：Apache Flink CEP, Esper CEP的应用案例：欺诈检测、异常监控、智能推荐动手实践：使用Flink CEP分析数据并进行复杂事件处理
模块 8：StarRocks 与 Flink 的集成 (下午)	使用 Flink CDC 实时同步数据库数据到 StarRocks 使用 Flink 连接器将 Flink 计算结果写入 StarRocks 利用 StarRocks 的高性能分析能力加速 Flink 的计算结果查询动手实践：配置 Flink CDC 同步数据到 StarRocks
第三天：实时数据分析应用与最佳实践模块 9：实时数据分析的应用场景 (上午)	实时监控与报警：系统监控、安全监控、业务监控实时推荐：个性化推荐、内容推送、广告投放实时欺诈检测：信用卡欺诈、网络攻击、交易风险实时数据可视化：仪表盘、报表、大屏展示实时决策：智能定价、库存优化、供应链管理
模块 10：构建实时数据分析系统的最佳实践 (上午)	选择合适的流计算引擎和实时数据库设计高效的数据模型和查询模式优化数据摄取和处理性能保障数据质量和数据安全实施监控和报警机制
模块 11：实时数据分析的架构模式 (下午)	Lambda架构：结合批处理和流处理 Kappa架构：简化架构，只依赖流处理流式数据湖架构：利用数据湖的低成本存储和灵活分析能力选择合适的架构模式：根据业务需求和技术栈
模块 12：实时数据分析的未来趋势 (下午)	AI驱动的实时数据分析：利用机器学习进行智能异常检测和预测云原生实时数据分析：基于云平台构建弹性伸缩的实时分析系统 Serverless实时数据分析：利用Serverless计算降低成本和运维复杂性开放讨论：学员分享对实时数据分析未来发展的看法
可选模块 (根据客户需求调整)	高级流计算技术： Exactly-Once语义、状态管理、窗口函数优化 StarRocks高级技术：数据分片、索引优化、查询优化特定行业实时数据分析案例：金融、零售、电商、物联网
工具与技术：	流计算引擎：Apache Flink, Apache Kafka Streams 实时数据库： StarRocks 消息队列：Apache Kafka, RabbitMQ 数据可视化：Tableau, Power BI, Grafana 云平台：AWS, Azure, Google Cloud

第一天：实时数据分析基础与流计算引擎
模块 1：实时数据分析概述 (上午)

实时数据的定义、特点和应用场景
传统数据分析与实时数据分析的对比
实时数据分析的价值与挑战
实时数据分析的架构与核心组件：数据源、流计算引擎、存储系统、可视化工具

模块 2：流计算引擎基础 (上午)

流计算引擎的定义与特点
有状态计算与无状态计算
Exactly-Once语义与容错机制
窗口函数 (Windowing) 的概念与类型：滚动窗口、滑动窗口、会话窗口
水印 (Watermark) 的作用：处理乱序数据和延迟数据

模块 3：Apache Flink技术详解 (下午)

Apache Flink的架构与核心组件：DataStream API, Table API, CEP
Flink的数据模型：Stream, DataSet, Table
Flink的窗口函数：Time-based Windows, Count-based Windows, Session Windows
Flink的容错机制：Checkpoint, Savepoint
动手实践：使用Flink DataStream API构建简单的流式数据处理程序

模块 4：Apache Kafka Streams技术详解 (下午)

Apache Kafka Streams的架构与核心组件：Topology, Processor, State Store
Kafka Streams的数据模型：KStream, KTable, GlobalKTable
Kafka Streams的窗口函数：Time Windows, Session Windows, Hopping Windows
Kafka Streams的容错机制：Changelog Topic
动手实践：使用Kafka Streams构建简单的流式数据处理程序

第二天：StarRocks 实时数据库与高级分析技术
模块 5：StarRocks技术详解 (上午)

StarRocks的架构与核心组件：FE, BE
StarRocks的数据模型：Table, Partition, Segment
StarRocks的查询语言：SQL
StarRocks的索引技术：Bitmap Index, Inverted Index, Prefix Index
StarRocks的存储引擎：列式存储引擎
动手实践：使用StarRocks存储和查询实时数据

模块 6：StarRocks的性能优化与管理 (上午)

StarRocks的数据导入方式：Stream Load, Broker Load, Routine Load
StarRocks的查询优化：查询重写, 索引选择, 执行计划
StarRocks的集群管理：扩容, 缩容, 故障恢复
StarRocks的监控与报警
动手实践：对StarRocks进行性能调优

模块 7：复杂事件处理 (CEP) 技术 (下午)

CEP的定义与应用场景
CEP的模式语言：定义事件模式、条件、时间约束
CEP的常用引擎：Apache Flink CEP, Esper
CEP的应用案例：欺诈检测、异常监控、智能推荐
动手实践：使用Flink CEP分析数据并进行复杂事件处理

模块 8：StarRocks 与 Flink 的集成 (下午)

使用 Flink CDC 实时同步数据库数据到 StarRocks
使用 Flink 连接器将 Flink 计算结果写入 StarRocks
利用 StarRocks 的高性能分析能力加速 Flink 的计算结果查询
动手实践：配置 Flink CDC 同步数据到 StarRocks

第三天：实时数据分析应用与最佳实践
模块 9：实时数据分析的应用场景 (上午)

实时监控与报警：系统监控、安全监控、业务监控
实时推荐：个性化推荐、内容推送、广告投放
实时欺诈检测：信用卡欺诈、网络攻击、交易风险
实时数据可视化：仪表盘、报表、大屏展示
实时决策：智能定价、库存优化、供应链管理

模块 10：构建实时数据分析系统的最佳实践 (上午)

选择合适的流计算引擎和实时数据库
设计高效的数据模型和查询模式
优化数据摄取和处理性能
保障数据质量和数据安全
实施监控和报警机制

模块 11：实时数据分析的架构模式 (下午)

Lambda架构：结合批处理和流处理
Kappa架构：简化架构，只依赖流处理
流式数据湖架构：利用数据湖的低成本存储和灵活分析能力
选择合适的架构模式：根据业务需求和技术栈

模块 12：实时数据分析的未来趋势 (下午)

AI驱动的实时数据分析：利用机器学习进行智能异常检测和预测
云原生实时数据分析：基于云平台构建弹性伸缩的实时分析系统
Serverless实时数据分析：利用Serverless计算降低成本和运维复杂性
开放讨论：学员分享对实时数据分析未来发展的看法

可选模块 (根据客户需求调整)

高级流计算技术： Exactly-Once语义、状态管理、窗口函数优化
StarRocks高级技术：数据分片、索引优化、查询优化
特定行业实时数据分析案例：金融、零售、电商、物联网

工具与技术：

流计算引擎：Apache Flink, Apache Kafka Streams
实时数据库： StarRocks
消息队列：Apache Kafka, RabbitMQ
数据可视化：Tableau, Power BI, Grafana
云平台：AWS, Azure, Google Cloud

实时数据分析：构建响应迅速的智能决策系统

Leon

资深架构师，流式计算领域专家

课程费用

6800.00 /人

课程时长

3天