课程费用

6800.00 /人

课程时长

3

成为教练

课程简介

理解 DeepSeek 大模型 (假设) 的特点、优势和局限性。
掌握基于 DeepSeek 构建各种 AI 应用的Prompt Engineering 技巧。
学习如何对 DeepSeek 大模型进行微调 (Fine-tuning),以适应特定业务场景。
掌握将 DeepSeek 大模型集成到现有系统中的方法。
了解如何评估和优化基于 DeepSeek 构建的应用的性能和效果。
能够构建基于 DeepSeek 的企业级 AI 应用原型系统。
了解基于LLM的企业应用合规性和安全实践。

目标收益

培训对象

机器学习工程师、AI 开发者、数据科学家、业务分析师、产品经理,以及希望利用大模型构建创新应用的企业技术人员。

课程大纲

第一天:DeepSeek 大模型概览与Prompt Engineering
模块 1:DeepSeek 大模型概览 (上午)
DeepSeek 大模型的架构特点 (Transformer-based, etc.)
DeepSeek 大模型的能力范围 (文本生成, 语言理解, 代码生成, etc.)
DeepSeek 大模型的优势与局限性 (推理速度, 上下文长度, 领域知识, etc.)
DeepSeek 大模型的部署方式 (API, 模型下载, etc.) 和成本考量
与其它主流大模型的对比分析 (GPT-3/4, PaLM, LLaMA, etc.)
模块 2:Prompt Engineering 基础 (上午) 什么是 Prompt Engineering? 核心原则和目标
Prompt 的构成要素: 指令, 上下文, 输入, 输出指示器
Prompt Engineering 的常用技巧:
零样本 (Zero-shot) / 小样本 (Few-shot) 学习
思维链 (Chain-of-Thought) Prompting
角色扮演 (Role-Playing) Prompting
提示模版设计与管理
模块 3:Prompt Engineering 实战 (下午) 针对不同任务设计 Prompt:
文本摘要 (Summarization)
内容生成 (Content Generation)
问题回答 (Question Answering)
文本翻译 (Translation)
代码生成 (Code Generation)
Prompt 优化与评估:
使用评估指标 (BLEU, ROUGE, etc.) 评估 Prompt 效果
A/B 测试不同 Prompt 变体
Prompt 注入攻击防范
模块 4:DeepSeek 大模型 API 使用 (假设) (下午) DeepSeek API 认证与授权
API 请求参数详解 (温度, Top-P, 长度限制, etc.)
API 调用错误处理与重试机制
API 使用最佳实践 (批量处理, 异步调用, etc.)
动手实践:通过 DeepSeek API 实现文本摘要、翻译等功能
第二天:DeepSeek 大模型微调 (Fine-tuning)
模块 5:微调 (Fine-tuning) 基础 (上午)
什么是微调? 为什么要微调?
微调的优势与局限性
微调的数据准备: 数据收集, 清洗, 标注
微调的策略:
完全微调 (Full Fine-tuning)
参数高效微调 (Parameter-Efficient Fine-tuning)
LoRA (Low-Rank Adaptation)
Prefix-Tuning
选择合适的微调策略
模块 6:DeepSeek 大模型微调实战 (假设) (上午) 选择微调框架: Hugging Face Transformers, etc.
准备微调数据集
配置微调参数: 学习率, Batch Size, Epochs
启动微调过程
监控微调过程: Loss 曲线, 评估指标
动手实践:使用 Hugging Face Transformers 对 DeepSeek 大模型进行微调
模块 7:微调模型评估与部署 (下午) 微调模型评估指标: 根据任务类型选择合适的评估指标
微调模型评估方法: 交叉验证, Holdout验证
微调模型部署:
API 部署: 使用 Flask, FastAPI 等框架
模型 Serving: 使用 TensorFlow Serving, TorchServe 等工具
模型监控与维护
模块 8:使用 Vector Database 增强 DeepSeek 应用 (下午) 向量数据库原理与 DeepSeek 模型嵌入
将非结构化数据向量化并储存在数据库中
使用向量数据库做语义检索
将检索到的上下文信息与 Prompt 结合,提升 LLM 效果
第三天:企业应用案例与最佳实践
模块 9:基于 DeepSeek 的企业应用案例 (上午)
智能客服: 构建自动回复客户咨询的聊天机器人
知识图谱构建: 从海量文本中提取知识并构建知识图谱
内容生成: 自动生成营销文案, 新闻稿, 技术文档
代码生成: 辅助程序员编写代码, 自动生成测试用例
行业应用:
金融风控: 欺诈检测, 信用评估
医疗诊断: 辅助医生进行疾病诊断
智能制造: 预测性维护, 质量检测
案例分析:分析优秀案例的技术架构、实现步骤和关键挑战
模块 10:将 DeepSeek 集成到现有系统 (上午) API 集成: 使用 API 网关统一管理 API
消息队列集成: 使用 Kafka, RabbitMQ 等消息队列进行异步处理
数据库集成: 将 DeepSeek 生成的数据存储到数据库中
用户界面集成: 在 Web 页面, 移动 App 中展示 DeepSeek 的结果
动手实践:设计将 DeepSeek 集成到现有系统的方案
模块 11:DeepSeek 应用性能与成本优化 (下午) 性能优化:
Prompt 优化
模型量化, 剪枝
使用 GPU 加速推理
成本优化:
选择合适的 API 计费方案
缓存 API 结果
控制 API 调用频率
动手实践:使用性能分析工具评估 DeepSeek 应用的性能瓶颈,并提出优化方案
模块 12:LLM 应用合规性和安全 (下午) LLM应用中的偏见问题与缓解方法
数据隐私保护措施:匿名化,差分隐私等
LLM应用的安全风险:提示注入、对抗性攻击等
Responsible AI 原则与实践
可信赖AI框架:欧盟AI法案等
动手实践:分析LLM 生成内容的偏见并设计缓解方案
工具与技术: DeepSeek 大模型 API (假设)
Hugging Face Transformers
Python
云平台 (AWS, Azure, Google Cloud)
向量数据库
Flask, FastAPI
Kafka, RabbitMQ
TensorBoard
第一天:DeepSeek 大模型概览与Prompt Engineering
模块 1:DeepSeek 大模型概览 (上午)
DeepSeek 大模型的架构特点 (Transformer-based, etc.)
DeepSeek 大模型的能力范围 (文本生成, 语言理解, 代码生成, etc.)
DeepSeek 大模型的优势与局限性 (推理速度, 上下文长度, 领域知识, etc.)
DeepSeek 大模型的部署方式 (API, 模型下载, etc.) 和成本考量
与其它主流大模型的对比分析 (GPT-3/4, PaLM, LLaMA, etc.)
模块 2:Prompt Engineering 基础 (上午)
什么是 Prompt Engineering? 核心原则和目标
Prompt 的构成要素: 指令, 上下文, 输入, 输出指示器
Prompt Engineering 的常用技巧:
零样本 (Zero-shot) / 小样本 (Few-shot) 学习
思维链 (Chain-of-Thought) Prompting
角色扮演 (Role-Playing) Prompting
提示模版设计与管理
模块 3:Prompt Engineering 实战 (下午)
针对不同任务设计 Prompt:
文本摘要 (Summarization)
内容生成 (Content Generation)
问题回答 (Question Answering)
文本翻译 (Translation)
代码生成 (Code Generation)
Prompt 优化与评估:
使用评估指标 (BLEU, ROUGE, etc.) 评估 Prompt 效果
A/B 测试不同 Prompt 变体
Prompt 注入攻击防范
模块 4:DeepSeek 大模型 API 使用 (假设) (下午)
DeepSeek API 认证与授权
API 请求参数详解 (温度, Top-P, 长度限制, etc.)
API 调用错误处理与重试机制
API 使用最佳实践 (批量处理, 异步调用, etc.)
动手实践:通过 DeepSeek API 实现文本摘要、翻译等功能
第二天:DeepSeek 大模型微调 (Fine-tuning)
模块 5:微调 (Fine-tuning) 基础 (上午)
什么是微调? 为什么要微调?
微调的优势与局限性
微调的数据准备: 数据收集, 清洗, 标注
微调的策略:
完全微调 (Full Fine-tuning)
参数高效微调 (Parameter-Efficient Fine-tuning)
LoRA (Low-Rank Adaptation)
Prefix-Tuning
选择合适的微调策略
模块 6:DeepSeek 大模型微调实战 (假设) (上午)
选择微调框架: Hugging Face Transformers, etc.
准备微调数据集
配置微调参数: 学习率, Batch Size, Epochs
启动微调过程
监控微调过程: Loss 曲线, 评估指标
动手实践:使用 Hugging Face Transformers 对 DeepSeek 大模型进行微调
模块 7:微调模型评估与部署 (下午)
微调模型评估指标: 根据任务类型选择合适的评估指标
微调模型评估方法: 交叉验证, Holdout验证
微调模型部署:
API 部署: 使用 Flask, FastAPI 等框架
模型 Serving: 使用 TensorFlow Serving, TorchServe 等工具
模型监控与维护
模块 8:使用 Vector Database 增强 DeepSeek 应用 (下午)
向量数据库原理与 DeepSeek 模型嵌入
将非结构化数据向量化并储存在数据库中
使用向量数据库做语义检索
将检索到的上下文信息与 Prompt 结合,提升 LLM 效果
第三天:企业应用案例与最佳实践
模块 9:基于 DeepSeek 的企业应用案例 (上午)
智能客服: 构建自动回复客户咨询的聊天机器人
知识图谱构建: 从海量文本中提取知识并构建知识图谱
内容生成: 自动生成营销文案, 新闻稿, 技术文档
代码生成: 辅助程序员编写代码, 自动生成测试用例
行业应用:
金融风控: 欺诈检测, 信用评估
医疗诊断: 辅助医生进行疾病诊断
智能制造: 预测性维护, 质量检测
案例分析:分析优秀案例的技术架构、实现步骤和关键挑战
模块 10:将 DeepSeek 集成到现有系统 (上午)
API 集成: 使用 API 网关统一管理 API
消息队列集成: 使用 Kafka, RabbitMQ 等消息队列进行异步处理
数据库集成: 将 DeepSeek 生成的数据存储到数据库中
用户界面集成: 在 Web 页面, 移动 App 中展示 DeepSeek 的结果
动手实践:设计将 DeepSeek 集成到现有系统的方案
模块 11:DeepSeek 应用性能与成本优化 (下午)
性能优化:
Prompt 优化
模型量化, 剪枝
使用 GPU 加速推理
成本优化:
选择合适的 API 计费方案
缓存 API 结果
控制 API 调用频率
动手实践:使用性能分析工具评估 DeepSeek 应用的性能瓶颈,并提出优化方案
模块 12:LLM 应用合规性和安全 (下午)
LLM应用中的偏见问题与缓解方法
数据隐私保护措施:匿名化,差分隐私等
LLM应用的安全风险:提示注入、对抗性攻击等
Responsible AI 原则与实践
可信赖AI框架:欧盟AI法案等
动手实践:分析LLM 生成内容的偏见并设计缓解方案
工具与技术:
DeepSeek 大模型 API (假设)
Hugging Face Transformers
Python
云平台 (AWS, Azure, Google Cloud)
向量数据库
Flask, FastAPI
Kafka, RabbitMQ
TensorBoard

课程费用

6800.00 /人

课程时长

3

预约体验票 我要分享

近期公开课推荐

近期公开课推荐

活动详情

站长统计
提交需求