课程简介
每当有新技术突破的时候,最流行的句式是“所有业务都可以用XX实现一遍”。AI大模型的突破,让所有人再次跃跃欲试。作为工程师,我们有机会站在驱动业务重构的最前沿,这里面有巨大的机会。在以传统机器学习为代表的类AI阶段,大家在技术层面往往会陷入语言/库之争,Python作为AI的门面语言,受到了极大关注,但同时也让非Python的工程师陷入两难:我要放弃现有的技术栈么?大模型的突破,让这一切不是问题。首先,AI大模型在应用层,API极为简单,对于有其他语言经验的工程师来讲并非难事。其次,过去的机器学习等知识体系,在大模型时代已没有特别大的必要去深入了(当然,了解更好)。过去在了解部分底层算法的前提下做调参,而现在调好prompt就可以了(当然,要用好它也不容易)。最后呢,目前各家语言平台都在快速跟进对AI的支持,比如Java方面,SpringAI提供了对AI Agent开发的支持。整体来说,AI产品开发和传统产品开发,最核心的点是:设计/开发/测试模式的变化。要理解这一点,必需先了解AI大模型本身的特点,及周边的生态。
那么,既然AI大模型的应用门槛不高,我们工程师该怎样基于AI构建自己的最核心竞争力,拓宽技术护城河,并持续赋能业务呢?这是我们本次课程的目标。
本次课程将从AI大模型行业现状、行业典型案例及实现、AI发展路线图、基于Copilot/Cursor等智能编码工具的研发效能提升、大模型核心逻辑、Prompt工程及调优、大模型应用开发、开源大模型微调流程等多个方面,从概念+实践的角度去学习最前沿的AI知识,从0打造AI时代的全栈护城河。
目标收益
培训对象
1、适合想进入AI领域,或者利用AI提升工作效能的工程师。
2、适合想开发AI产品,或者使用开源大模型构建垂直业务模型的工程师。
3、适合想更全面判断AI趋势、或者利用AI为现有业务赋能的技术管理者。
课程大纲
引子 | AI大模型通识、生态与发展;Prompt工程与应用、AI Agent应用开发、开源大模型微调与推理等 |
第一单元 AI大模型通识 |
1.AI大模型通识 1.1大模型的定义与特点 1.2大模型的分类与应用 1.3大模型的底层工作原理 1.4开源 vs 闭源大模型 1.5Token模式与定价 2.AI大模型生态及发展 2.1国内外主流大模型介绍 2.2AI+赋能场景案例介绍 |
第二单元 Prompt应用、模式与工程 |
3.Prompt工程与实践 3.1Prompt核心要素与案例 3.2Prompt常见思维框架 3.3如何理解思维链 vs 思维树 3.4Prompt的攻击/安全问题 3.5Prompt工程≈软件工程 |
第三单元 AI与工程师 |
4.编码大模型与工具 4.1智能编码目前包含哪些能力 4.2常见智能编码模型(Codex、DeepSeek Coder、CodeLlama等) 4.3Agent模式下的 Copilot/Cursor/Trae应用 4.4AI辅助下的全栈开发工作流 5.AI重塑产/研/测 5.1AI与产品经理 5.2AI与研发工程师 5.3AI与测试工程师 |
第四单元 AI Agent应用开发实战 |
6.AI Agent工程与案例 6.1Agent应用模式与架构 6.2案例:斯坦福小镇 7.Agent应用开发实践 7.1快速实现一个Chat程序 7.2核心参数列表 model参数 角色与指令 7.3实现多轮对话 7.4Function Calling机制 7.5实现智能订餐助手 7.6数据与函数准备 7.7工具(函数)调用 7.8缓解幻觉问题 8.大模型开发框架LangChain 8.1LangChain介绍 8.2LangChain概念与组件 8.3LangChain安装与配置 8.4LangChain表达式语言:LCEL 8.5LangServe服务部署 8.6使用LangChain构建数据分析Agent 8.7使用LangGraph构建/编排复杂Agent工作流 9.从零搭建基于知识库的智能客服系统 9.1知识库是什么? 9.2理解RAG与Embedding 9.3向量数据库与语义检索 9.4搭建企业智能客服系统 10.AI Agent工具搭建与编排 10.1使用Dify平台搭建Agent应用 10.2使用Coze平台搭建工作流 |
第五单元 开源大模型及微调/推理方案 |
11.开源大模型:垂直模型的基座 11.1开源大模型串讲:Llama3、ChatGLM3/4、Qwen、DeepSeek 11.2快速搭建本地开源模型环境(ollama+openwebui) 11.3Hugging Face:AI界的Github 11.4开源微调:构建基于垂直行业的私有大模型(基于PEFT/LoRA、Llama-Factory) 11.5基于vLLM搭建模型推理服务 11.6基于开源模型构建Agent应用 11.7多模态大模型(视觉理解/目标检测) 11.8延展:GPU/显卡、LPU推理引擎等交付资源选型。 |
引子 AI大模型通识、生态与发展;Prompt工程与应用、AI Agent应用开发、开源大模型微调与推理等 |
第一单元 AI大模型通识 1.AI大模型通识 1.1大模型的定义与特点 1.2大模型的分类与应用 1.3大模型的底层工作原理 1.4开源 vs 闭源大模型 1.5Token模式与定价 2.AI大模型生态及发展 2.1国内外主流大模型介绍 2.2AI+赋能场景案例介绍 |
第二单元 Prompt应用、模式与工程 3.Prompt工程与实践 3.1Prompt核心要素与案例 3.2Prompt常见思维框架 3.3如何理解思维链 vs 思维树 3.4Prompt的攻击/安全问题 3.5Prompt工程≈软件工程 |
第三单元 AI与工程师 4.编码大模型与工具 4.1智能编码目前包含哪些能力 4.2常见智能编码模型(Codex、DeepSeek Coder、CodeLlama等) 4.3Agent模式下的 Copilot/Cursor/Trae应用 4.4AI辅助下的全栈开发工作流 5.AI重塑产/研/测 5.1AI与产品经理 5.2AI与研发工程师 5.3AI与测试工程师 |
第四单元 AI Agent应用开发实战 6.AI Agent工程与案例 6.1Agent应用模式与架构 6.2案例:斯坦福小镇 7.Agent应用开发实践 7.1快速实现一个Chat程序 7.2核心参数列表 model参数 角色与指令 7.3实现多轮对话 7.4Function Calling机制 7.5实现智能订餐助手 7.6数据与函数准备 7.7工具(函数)调用 7.8缓解幻觉问题 8.大模型开发框架LangChain 8.1LangChain介绍 8.2LangChain概念与组件 8.3LangChain安装与配置 8.4LangChain表达式语言:LCEL 8.5LangServe服务部署 8.6使用LangChain构建数据分析Agent 8.7使用LangGraph构建/编排复杂Agent工作流 9.从零搭建基于知识库的智能客服系统 9.1知识库是什么? 9.2理解RAG与Embedding 9.3向量数据库与语义检索 9.4搭建企业智能客服系统 10.AI Agent工具搭建与编排 10.1使用Dify平台搭建Agent应用 10.2使用Coze平台搭建工作流 |
第五单元 开源大模型及微调/推理方案 11.开源大模型:垂直模型的基座 11.1开源大模型串讲:Llama3、ChatGLM3/4、Qwen、DeepSeek 11.2快速搭建本地开源模型环境(ollama+openwebui) 11.3Hugging Face:AI界的Github 11.4开源微调:构建基于垂直行业的私有大模型(基于PEFT/LoRA、Llama-Factory) 11.5基于vLLM搭建模型推理服务 11.6基于开源模型构建Agent应用 11.7多模态大模型(视觉理解/目标检测) 11.8延展:GPU/显卡、LPU推理引擎等交付资源选型。 |