课程简介
聚焦DeepSeek大模型技术体系的全面解析。从模型架构、训练范式到部署实践,系统性地介绍DeepSeek从V1到R1的技术演进历程,并结合实际案例讲解大模型在工业场景中的落地应用。
目标收益
掌握DeepSeek大模型的核心技术原理和创新点
学习大模型训练、微调和部署的实践技能
了解MoE架构和分布式训练的关键技术
掌握模型应用落地的最佳实践经验
培训对象
AI算法工程师
机器学习研究员
深度学习开发工程师
大模型应用开发人员
对大模型技术感兴趣的技术管理者
课程大纲
第一天 上午 9:00-12:00 DeepSeek演进路线及核心技术 |
- DeepSeek发展里程碑:从Coder到R1的完整演进路线 - MoE架构创新:从Dense到MoE的技术突破 - 核心训练范式:SFT、RL原理与应用 - 推理增强技术:CoT和搜索算法的实践应用 - 并行计算技术:DP、EP、PP、TP的协同机制 |
下午14:00-16:00 DeepSeek高效推理部署 |
- 全参数模型部署方案与硬件规划 - 分布式推理性能优化技巧 - Ollama蒸馏模型部署流程 - VLLM推理加速框架实践 - NPU部署方案与性能调优 |
第二天 上午 9:00-12:00 DeepSeek训练微调与蒸馏 |
- R1-Zero纯强化学习训练原理 - 多阶段增强训练策略 - 模型蒸馏技术实践 - Unsloth训练推理模型实践 - GRPO算法与奖励模型训练实战 |
下午14:00-16:00 DeepSeek应用实践 |
- deepseek Prompt工程最佳实践 - 思维链应用案例分析 - 垂直领域RAG应用方案 - 分布式推理训练集群趋势 - 技术发展趋势与未来展望 |
第一天 上午 9:00-12:00 DeepSeek演进路线及核心技术 - DeepSeek发展里程碑:从Coder到R1的完整演进路线 - MoE架构创新:从Dense到MoE的技术突破 - 核心训练范式:SFT、RL原理与应用 - 推理增强技术:CoT和搜索算法的实践应用 - 并行计算技术:DP、EP、PP、TP的协同机制 |
下午14:00-16:00 DeepSeek高效推理部署 - 全参数模型部署方案与硬件规划 - 分布式推理性能优化技巧 - Ollama蒸馏模型部署流程 - VLLM推理加速框架实践 - NPU部署方案与性能调优 |
第二天 上午 9:00-12:00 DeepSeek训练微调与蒸馏 - R1-Zero纯强化学习训练原理 - 多阶段增强训练策略 - 模型蒸馏技术实践 - Unsloth训练推理模型实践 - GRPO算法与奖励模型训练实战 |
下午14:00-16:00 DeepSeek应用实践 - deepseek Prompt工程最佳实践 - 思维链应用案例分析 - 垂直领域RAG应用方案 - 分布式推理训练集群趋势 - 技术发展趋势与未来展望 |