课程费用

6800.00 /人

课程时长

2

成为教练

课程简介

聚焦DeepSeek大模型技术体系的全面解析。从模型架构、训练范式到部署实践,系统性地介绍DeepSeek从V1到R1的技术演进历程,并结合实际案例讲解大模型在工业场景中的落地应用。

目标收益

掌握DeepSeek大模型的核心技术原理和创新点
学习大模型训练、微调和部署的实践技能
了解MoE架构和分布式训练的关键技术
掌握模型应用落地的最佳实践经验

培训对象

AI算法工程师
机器学习研究员
深度学习开发工程师
大模型应用开发人员
对大模型技术感兴趣的技术管理者

课程大纲

第一天
上午 9:00-12:00
DeepSeek演进路线及核心技术
- DeepSeek发展里程碑:从Coder到R1的完整演进路线
- MoE架构创新:从Dense到MoE的技术突破
- 核心训练范式:SFT、RL原理与应用
- 推理增强技术:CoT和搜索算法的实践应用
- 并行计算技术:DP、EP、PP、TP的协同机制
下午14:00-16:00
DeepSeek高效推理部署
- 全参数模型部署方案与硬件规划
- 分布式推理性能优化技巧
- Ollama蒸馏模型部署流程
- VLLM推理加速框架实践
- NPU部署方案与性能调优
第二天
上午 9:00-12:00
DeepSeek训练微调与蒸馏
- R1-Zero纯强化学习训练原理
- 多阶段增强训练策略
- 模型蒸馏技术实践
- Unsloth训练推理模型实践
- GRPO算法与奖励模型训练实战
下午14:00-16:00
DeepSeek应用实践
- deepseek Prompt工程最佳实践
- 思维链应用案例分析
- 垂直领域RAG应用方案
- 分布式推理训练集群趋势
- 技术发展趋势与未来展望
第一天
上午 9:00-12:00
DeepSeek演进路线及核心技术
- DeepSeek发展里程碑:从Coder到R1的完整演进路线
- MoE架构创新:从Dense到MoE的技术突破
- 核心训练范式:SFT、RL原理与应用
- 推理增强技术:CoT和搜索算法的实践应用
- 并行计算技术:DP、EP、PP、TP的协同机制
下午14:00-16:00
DeepSeek高效推理部署
- 全参数模型部署方案与硬件规划
- 分布式推理性能优化技巧
- Ollama蒸馏模型部署流程
- VLLM推理加速框架实践
- NPU部署方案与性能调优
第二天
上午 9:00-12:00
DeepSeek训练微调与蒸馏

- R1-Zero纯强化学习训练原理
- 多阶段增强训练策略
- 模型蒸馏技术实践
- Unsloth训练推理模型实践
- GRPO算法与奖励模型训练实战
下午14:00-16:00
DeepSeek应用实践
- deepseek Prompt工程最佳实践
- 思维链应用案例分析
- 垂直领域RAG应用方案
- 分布式推理训练集群趋势
- 技术发展趋势与未来展望

课程费用

6800.00 /人

课程时长

2

预约体验票 我要分享

近期公开课推荐

近期公开课推荐

活动详情

提交需求