课程简介
课程系统解析大模型核心概念、技术演进与产业实践。内容涵盖 Transformer 原理、提示工程、RAG 检索增强、智能体与工作流设计,以及大模型微调技术(如 LoRA、RLHF)。课程结合企业真实案例,深入探讨大模型在内容创作、客服、金融、医疗等场景的应用,帮助企业构建专属 AI 能力,实现业务流程智能化升级。
目标收益
帮助企业⼈员掌握⼤模型基础知识,灵活运⽤实⽤微调技巧,了解常⻅应⽤模式,拓宽在企业内有效应⽤⼤模型的思路,提升对应⽤⽅法和效果的判断⼒。
培训对象
企业 AI 技术负责人、算法工程师
产品经理与解决方案架构师
希望用大模型优化业务流程的 IT 管理者
具备 Python 基础的数据分析师、开发者
课程大纲
| 模块⼀:⼤模型及应⽤的基本原理 |
1、⼤模型是什么,能做什么 ◦ ⼤模型简史及基本原理 ◦ 模型推理的详细过程 ◦ 深⼊浅出神经⽹络、深度学习、Transformer架构、训练、微调、推理、提⽰词、记忆、思维 链、涌现等概念 2、⼤模型的类型及选择 ◦ ⽂本、图像、语⾳、多模态 ◦ 从参数规模看⼤模型 ◦ 通⽤⼤模型 vs 垂域⼤模型,常⻅认识误区 ◦ 主流⼤模型的特点(OpenAI、Claude、Grok、DeepSeek等) ◦ ⼤模型选择关键在对任务的理解 3、⼤模型的能⼒强弱体现在哪 ◦ 理解任务的难度差异 ◦ 指令跟随、窗⼝、注意⼒、推理、幻觉与噪⾳ ◦ DeepSeek的思考过程是怎么回事 4、从⼤模型到具体应⽤ ◦ 内容创作、信息检索、创意辅助、流程优化应⽤的实现原理 ◦ 分析常⻅应⽤的实现⽅法 ◦ 具⾝智能 ◦ ⼤模型在业内的供应链 5、深⼊的提⽰词经验 ◦ 多轮对话 vs 总结上下⽂重新问问题 ◦ 拿理想结果让⼤模型⾃⼰优化提⽰词 ◦ 按⽅法论的指导⽣成或提炼经验 ◦ 定义输出流程控制思维链过程 ◦ feedback-refine,互弈 |
| 模块⼆:检索增强(RAG)类应⽤ |
1、RAG应⽤的典型步骤流程 ◦ 简单RAG的实现原理及流程 ◦ RAG适合的应⽤类型 2、知识⼯程是提升应⽤效果的关键 ◦ 联⽹检索:搜索关键词⽣成及结果评估 ◦ 内部⽂档处理:⽂档切分、清洗、深加⼯和标准化 ◦ 向量化与存储:将知识转为模型可理解的格式 ◦ 检索机制:提⾼相关性和准确性 ◦ ⽣成策略:如何结合检索结果与⼤模型能⼒ ◦ 解决知识的时效性与专业性难题 3、RAG应⽤案例解析 ◦ 基于⽂档或结构化数据的智能问答 ◦ RAG应⽤的挑战及对策 |
| 模块三:智能体(Agent)和⼯作流(Workflow)类应⽤ |
1、Agent和Workflow类应⽤的流程 ◦ 什么是AI Agent,⼀个简单的Agent是怎么实现的? ◦ Agent如何体现主动性及对⼯具的调⽤ ◦ Agent的核⼼能⼒:规划、执⾏、反思与调整、记忆 ◦ ⽤Agent做智能客服的挑战 ◦ 什么是Workflow? ◦ 如何在Agent和Workflow间做选择? 2、 对现有业务的深⼊建模是提升应⽤效果的关键 ◦ 建模思路和案例 ◦ 利⽤现有平台快速搭建Agent或Workflow 3、应⽤案例解析 ◦ ⽅案⾃动评估、流程⾃动化、协调与决策 ◦ 智能客服 ◦ 销售专家 |
| 模块四:⼤模型微调 |
1、预训练、继续预训练、微调的适⽤场景及效果预期 ◦ 预训练、继续预训练的技术路径及其优势 ◦ 微调与预训练的边界与联系 ◦ 不同模型规模下的训练策略选择 2、全参微调及各类参数⾼效微调技术(PEFT) ◦ 全参数微调的技术原理与挑战 ◦ LoRA与QLoRA:原理、实现与优化 ◦ Adapter与Prefix Tuning技术详解 ◦ 参数⾼效微调⽅法的性能对⽐与选择指南 3、指令微调的数据准备、环境搭建及实施步骤 ◦ 指令微调数据集的构建原则与最佳实践 ◦ 基于⼈类反馈的强化学习(RLHF)实现 ◦ DPO与PPO技术原理与实施流程 4、垂直领域微调应⽤及提升微调效果的实⽤策略 ◦ 医疗、⾦融、法律等垂直领域的微调特点 ◦ 提⽰⼯程与微调的结合⽅法 ◦ 领域知识注⼊与对⻬技术 5、微调模型的评估与部署 ◦ ⼤模型评估指标体系与⽅法论 ◦ 微调模型的量化与推理优化 ◦ 模型部署架构与服务化设计 |
|
模块⼀:⼤模型及应⽤的基本原理 1、⼤模型是什么,能做什么 ◦ ⼤模型简史及基本原理 ◦ 模型推理的详细过程 ◦ 深⼊浅出神经⽹络、深度学习、Transformer架构、训练、微调、推理、提⽰词、记忆、思维 链、涌现等概念 2、⼤模型的类型及选择 ◦ ⽂本、图像、语⾳、多模态 ◦ 从参数规模看⼤模型 ◦ 通⽤⼤模型 vs 垂域⼤模型,常⻅认识误区 ◦ 主流⼤模型的特点(OpenAI、Claude、Grok、DeepSeek等) ◦ ⼤模型选择关键在对任务的理解 3、⼤模型的能⼒强弱体现在哪 ◦ 理解任务的难度差异 ◦ 指令跟随、窗⼝、注意⼒、推理、幻觉与噪⾳ ◦ DeepSeek的思考过程是怎么回事 4、从⼤模型到具体应⽤ ◦ 内容创作、信息检索、创意辅助、流程优化应⽤的实现原理 ◦ 分析常⻅应⽤的实现⽅法 ◦ 具⾝智能 ◦ ⼤模型在业内的供应链 5、深⼊的提⽰词经验 ◦ 多轮对话 vs 总结上下⽂重新问问题 ◦ 拿理想结果让⼤模型⾃⼰优化提⽰词 ◦ 按⽅法论的指导⽣成或提炼经验 ◦ 定义输出流程控制思维链过程 ◦ feedback-refine,互弈 |
|
模块⼆:检索增强(RAG)类应⽤ 1、RAG应⽤的典型步骤流程 ◦ 简单RAG的实现原理及流程 ◦ RAG适合的应⽤类型 2、知识⼯程是提升应⽤效果的关键 ◦ 联⽹检索:搜索关键词⽣成及结果评估 ◦ 内部⽂档处理:⽂档切分、清洗、深加⼯和标准化 ◦ 向量化与存储:将知识转为模型可理解的格式 ◦ 检索机制:提⾼相关性和准确性 ◦ ⽣成策略:如何结合检索结果与⼤模型能⼒ ◦ 解决知识的时效性与专业性难题 3、RAG应⽤案例解析 ◦ 基于⽂档或结构化数据的智能问答 ◦ RAG应⽤的挑战及对策 |
|
模块三:智能体(Agent)和⼯作流(Workflow)类应⽤ 1、Agent和Workflow类应⽤的流程 ◦ 什么是AI Agent,⼀个简单的Agent是怎么实现的? ◦ Agent如何体现主动性及对⼯具的调⽤ ◦ Agent的核⼼能⼒:规划、执⾏、反思与调整、记忆 ◦ ⽤Agent做智能客服的挑战 ◦ 什么是Workflow? ◦ 如何在Agent和Workflow间做选择? 2、 对现有业务的深⼊建模是提升应⽤效果的关键 ◦ 建模思路和案例 ◦ 利⽤现有平台快速搭建Agent或Workflow 3、应⽤案例解析 ◦ ⽅案⾃动评估、流程⾃动化、协调与决策 ◦ 智能客服 ◦ 销售专家 |
|
模块四:⼤模型微调 1、预训练、继续预训练、微调的适⽤场景及效果预期 ◦ 预训练、继续预训练的技术路径及其优势 ◦ 微调与预训练的边界与联系 ◦ 不同模型规模下的训练策略选择 2、全参微调及各类参数⾼效微调技术(PEFT) ◦ 全参数微调的技术原理与挑战 ◦ LoRA与QLoRA:原理、实现与优化 ◦ Adapter与Prefix Tuning技术详解 ◦ 参数⾼效微调⽅法的性能对⽐与选择指南 3、指令微调的数据准备、环境搭建及实施步骤 ◦ 指令微调数据集的构建原则与最佳实践 ◦ 基于⼈类反馈的强化学习(RLHF)实现 ◦ DPO与PPO技术原理与实施流程 4、垂直领域微调应⽤及提升微调效果的实⽤策略 ◦ 医疗、⾦融、法律等垂直领域的微调特点 ◦ 提⽰⼯程与微调的结合⽅法 ◦ 领域知识注⼊与对⻬技术 5、微调模型的评估与部署 ◦ ⼤模型评估指标体系与⽅法论 ◦ 微调模型的量化与推理优化 ◦ 模型部署架构与服务化设计 |
近期公开课推荐