课程简介
理解 DeepSeek 大模型 (假设) 的特点、优势和局限性。
掌握基于 DeepSeek 构建各种 AI 应用的Prompt Engineering 技巧。
学习如何对 DeepSeek 大模型进行微调 (Fine-tuning),以适应特定业务场景。
掌握将 DeepSeek 大模型集成到现有系统中的方法。
了解如何评估和优化基于 DeepSeek 构建的应用的性能和效果。
能够构建基于 DeepSeek 的企业级 AI 应用原型系统。
了解基于LLM的企业应用合规性和安全实践。
目标收益
培训对象
机器学习工程师、AI 开发者、数据科学家、业务分析师、产品经理,以及希望利用大模型构建创新应用的企业技术人员。
课程大纲
第一天:DeepSeek 大模型概览与Prompt Engineering 模块 1:DeepSeek 大模型概览 (上午) |
DeepSeek 大模型的架构特点 (Transformer-based, etc.) DeepSeek 大模型的能力范围 (文本生成, 语言理解, 代码生成, etc.) DeepSeek 大模型的优势与局限性 (推理速度, 上下文长度, 领域知识, etc.) DeepSeek 大模型的部署方式 (API, 模型下载, etc.) 和成本考量 与其它主流大模型的对比分析 (GPT-3/4, PaLM, LLaMA, etc.) |
模块 2:Prompt Engineering 基础 (上午) |
什么是 Prompt Engineering? 核心原则和目标 Prompt 的构成要素: 指令, 上下文, 输入, 输出指示器 Prompt Engineering 的常用技巧: 零样本 (Zero-shot) / 小样本 (Few-shot) 学习 思维链 (Chain-of-Thought) Prompting 角色扮演 (Role-Playing) Prompting 提示模版设计与管理 |
模块 3:Prompt Engineering 实战 (下午) |
针对不同任务设计 Prompt: 文本摘要 (Summarization) 内容生成 (Content Generation) 问题回答 (Question Answering) 文本翻译 (Translation) 代码生成 (Code Generation) Prompt 优化与评估: 使用评估指标 (BLEU, ROUGE, etc.) 评估 Prompt 效果 A/B 测试不同 Prompt 变体 Prompt 注入攻击防范 |
模块 4:DeepSeek 大模型 API 使用 (假设) (下午) |
DeepSeek API 认证与授权 API 请求参数详解 (温度, Top-P, 长度限制, etc.) API 调用错误处理与重试机制 API 使用最佳实践 (批量处理, 异步调用, etc.) 动手实践:通过 DeepSeek API 实现文本摘要、翻译等功能 |
第二天:DeepSeek 大模型微调 (Fine-tuning) 模块 5:微调 (Fine-tuning) 基础 (上午) |
什么是微调? 为什么要微调? 微调的优势与局限性 微调的数据准备: 数据收集, 清洗, 标注 微调的策略: 完全微调 (Full Fine-tuning) 参数高效微调 (Parameter-Efficient Fine-tuning) LoRA (Low-Rank Adaptation) Prefix-Tuning 选择合适的微调策略 |
模块 6:DeepSeek 大模型微调实战 (假设) (上午) |
选择微调框架: Hugging Face Transformers, etc. 准备微调数据集 配置微调参数: 学习率, Batch Size, Epochs 启动微调过程 监控微调过程: Loss 曲线, 评估指标 动手实践:使用 Hugging Face Transformers 对 DeepSeek 大模型进行微调 |
模块 7:微调模型评估与部署 (下午) |
微调模型评估指标: 根据任务类型选择合适的评估指标 微调模型评估方法: 交叉验证, Holdout验证 微调模型部署: API 部署: 使用 Flask, FastAPI 等框架 模型 Serving: 使用 TensorFlow Serving, TorchServe 等工具 模型监控与维护 |
模块 8:使用 Vector Database 增强 DeepSeek 应用 (下午) |
向量数据库原理与 DeepSeek 模型嵌入 将非结构化数据向量化并储存在数据库中 使用向量数据库做语义检索 将检索到的上下文信息与 Prompt 结合,提升 LLM 效果 |
第三天:企业应用案例与最佳实践 模块 9:基于 DeepSeek 的企业应用案例 (上午) |
智能客服: 构建自动回复客户咨询的聊天机器人 知识图谱构建: 从海量文本中提取知识并构建知识图谱 内容生成: 自动生成营销文案, 新闻稿, 技术文档 代码生成: 辅助程序员编写代码, 自动生成测试用例 行业应用: 金融风控: 欺诈检测, 信用评估 医疗诊断: 辅助医生进行疾病诊断 智能制造: 预测性维护, 质量检测 案例分析:分析优秀案例的技术架构、实现步骤和关键挑战 |
模块 10:将 DeepSeek 集成到现有系统 (上午) |
API 集成: 使用 API 网关统一管理 API 消息队列集成: 使用 Kafka, RabbitMQ 等消息队列进行异步处理 数据库集成: 将 DeepSeek 生成的数据存储到数据库中 用户界面集成: 在 Web 页面, 移动 App 中展示 DeepSeek 的结果 动手实践:设计将 DeepSeek 集成到现有系统的方案 |
模块 11:DeepSeek 应用性能与成本优化 (下午) |
性能优化: Prompt 优化 模型量化, 剪枝 使用 GPU 加速推理 成本优化: 选择合适的 API 计费方案 缓存 API 结果 控制 API 调用频率 动手实践:使用性能分析工具评估 DeepSeek 应用的性能瓶颈,并提出优化方案 |
模块 12:LLM 应用合规性和安全 (下午) |
LLM应用中的偏见问题与缓解方法 数据隐私保护措施:匿名化,差分隐私等 LLM应用的安全风险:提示注入、对抗性攻击等 Responsible AI 原则与实践 可信赖AI框架:欧盟AI法案等 动手实践:分析LLM 生成内容的偏见并设计缓解方案 |
工具与技术: |
DeepSeek 大模型 API (假设) Hugging Face Transformers Python 云平台 (AWS, Azure, Google Cloud) 向量数据库 Flask, FastAPI Kafka, RabbitMQ TensorBoard |
第一天:DeepSeek 大模型概览与Prompt Engineering 模块 1:DeepSeek 大模型概览 (上午) DeepSeek 大模型的架构特点 (Transformer-based, etc.) DeepSeek 大模型的能力范围 (文本生成, 语言理解, 代码生成, etc.) DeepSeek 大模型的优势与局限性 (推理速度, 上下文长度, 领域知识, etc.) DeepSeek 大模型的部署方式 (API, 模型下载, etc.) 和成本考量 与其它主流大模型的对比分析 (GPT-3/4, PaLM, LLaMA, etc.) |
模块 2:Prompt Engineering 基础 (上午) 什么是 Prompt Engineering? 核心原则和目标 Prompt 的构成要素: 指令, 上下文, 输入, 输出指示器 Prompt Engineering 的常用技巧: 零样本 (Zero-shot) / 小样本 (Few-shot) 学习 思维链 (Chain-of-Thought) Prompting 角色扮演 (Role-Playing) Prompting 提示模版设计与管理 |
模块 3:Prompt Engineering 实战 (下午) 针对不同任务设计 Prompt: 文本摘要 (Summarization) 内容生成 (Content Generation) 问题回答 (Question Answering) 文本翻译 (Translation) 代码生成 (Code Generation) Prompt 优化与评估: 使用评估指标 (BLEU, ROUGE, etc.) 评估 Prompt 效果 A/B 测试不同 Prompt 变体 Prompt 注入攻击防范 |
模块 4:DeepSeek 大模型 API 使用 (假设) (下午) DeepSeek API 认证与授权 API 请求参数详解 (温度, Top-P, 长度限制, etc.) API 调用错误处理与重试机制 API 使用最佳实践 (批量处理, 异步调用, etc.) 动手实践:通过 DeepSeek API 实现文本摘要、翻译等功能 |
第二天:DeepSeek 大模型微调 (Fine-tuning) 模块 5:微调 (Fine-tuning) 基础 (上午) 什么是微调? 为什么要微调? 微调的优势与局限性 微调的数据准备: 数据收集, 清洗, 标注 微调的策略: 完全微调 (Full Fine-tuning) 参数高效微调 (Parameter-Efficient Fine-tuning) LoRA (Low-Rank Adaptation) Prefix-Tuning 选择合适的微调策略 |
模块 6:DeepSeek 大模型微调实战 (假设) (上午) 选择微调框架: Hugging Face Transformers, etc. 准备微调数据集 配置微调参数: 学习率, Batch Size, Epochs 启动微调过程 监控微调过程: Loss 曲线, 评估指标 动手实践:使用 Hugging Face Transformers 对 DeepSeek 大模型进行微调 |
模块 7:微调模型评估与部署 (下午) 微调模型评估指标: 根据任务类型选择合适的评估指标 微调模型评估方法: 交叉验证, Holdout验证 微调模型部署: API 部署: 使用 Flask, FastAPI 等框架 模型 Serving: 使用 TensorFlow Serving, TorchServe 等工具 模型监控与维护 |
模块 8:使用 Vector Database 增强 DeepSeek 应用 (下午) 向量数据库原理与 DeepSeek 模型嵌入 将非结构化数据向量化并储存在数据库中 使用向量数据库做语义检索 将检索到的上下文信息与 Prompt 结合,提升 LLM 效果 |
第三天:企业应用案例与最佳实践 模块 9:基于 DeepSeek 的企业应用案例 (上午) 智能客服: 构建自动回复客户咨询的聊天机器人 知识图谱构建: 从海量文本中提取知识并构建知识图谱 内容生成: 自动生成营销文案, 新闻稿, 技术文档 代码生成: 辅助程序员编写代码, 自动生成测试用例 行业应用: 金融风控: 欺诈检测, 信用评估 医疗诊断: 辅助医生进行疾病诊断 智能制造: 预测性维护, 质量检测 案例分析:分析优秀案例的技术架构、实现步骤和关键挑战 |
模块 10:将 DeepSeek 集成到现有系统 (上午) API 集成: 使用 API 网关统一管理 API 消息队列集成: 使用 Kafka, RabbitMQ 等消息队列进行异步处理 数据库集成: 将 DeepSeek 生成的数据存储到数据库中 用户界面集成: 在 Web 页面, 移动 App 中展示 DeepSeek 的结果 动手实践:设计将 DeepSeek 集成到现有系统的方案 |
模块 11:DeepSeek 应用性能与成本优化 (下午) 性能优化: Prompt 优化 模型量化, 剪枝 使用 GPU 加速推理 成本优化: 选择合适的 API 计费方案 缓存 API 结果 控制 API 调用频率 动手实践:使用性能分析工具评估 DeepSeek 应用的性能瓶颈,并提出优化方案 |
模块 12:LLM 应用合规性和安全 (下午) LLM应用中的偏见问题与缓解方法 数据隐私保护措施:匿名化,差分隐私等 LLM应用的安全风险:提示注入、对抗性攻击等 Responsible AI 原则与实践 可信赖AI框架:欧盟AI法案等 动手实践:分析LLM 生成内容的偏见并设计缓解方案 |
工具与技术: DeepSeek 大模型 API (假设) Hugging Face Transformers Python 云平台 (AWS, Azure, Google Cloud) 向量数据库 Flask, FastAPI Kafka, RabbitMQ TensorBoard |