课程简介
本课程全面深入地解析大模型技术,从基础理论到前沿应用,帮助学员构建大模型的完整知识体系。通过系统讲解帮助学员掌握大模型的核心技术。课程还涵盖了提示工程、CoT与Agent技术的原理与实践,讲解大模型微调、RLHF方法、分布式训练技术等前沿知识,进一步巩固技术栈。此外,学员将通过实战环节,亲手搭建大模型RAG系统,并学习推理加速方法和量化技术,最终掌握大模型在企业中的落地与应用。课程特别适合技术团队、AI从业者及企业负责人,帮助学员在AI技术领域得到提升,协助企业挖掘大模型应用场景及商业化模式。
目标收益
培训对象
课程内容
第一天上午
大模型基础概述(90分钟)
1、介绍人工智能生成创作(AIGC)领域的基本概念、应用和发展趋势,相关场景及算法基础逻辑介绍
2、大模型基础技术概述,介绍深度学习相关基础与Transformers系列介绍
大模型提示工程(60分钟)
1、介绍大模型提示工程原理,简述CoT相关技术链
2、模型中的提示词设计及优化技巧
3、多场景提示词设计介绍
大模型中的Agent技术(30分钟)
1、CoT基础原理介绍
2、Agent基础概述、主要模块与决策机制
第一天下午
主流开源语言大模型介绍与领域大模型简述(120分钟)
1、主流大模型介绍,如GLM、Llama、bloom、MOSS、Baichuan、Qwen、Skywork等
2、领域大模型介绍——法律、医疗、金融、教育等领域大模型介绍
大模型中的RLHF(60分钟)
1、简述模型中的奖励模型,包括介绍奖励模型基础、数据设计及模型训练方法
2、强化学习基础介绍,PPO算法代码与原理详解、
3、前沿偏好对齐算法介绍——RRHF、RLAIF、DPO、APO等
第二天上午
大语言模的数据构造与SFT(90分钟)
1、大模型中的数据构造与清洗方法综合介绍
2、常用参数微调方法——Prefix Tuning、P-Tuning、LoRA
3、介绍分布式训练方法与常见分布式框架
大模型微调(30分钟)
以问数场景为例,进行大模型训练微调实战
大模型中的推理加速(60分钟)
1、介绍大模型推理加速中的量化方法
2、介绍常用大模型推理加速框架——vLLM、FastLLM、Slang等
第二天下午
大模型与RAG(60分钟)
1、介绍RAG相关原理
2、向量数据库介绍——Faiss、Milvus、Pinecone、Weaviate等
3、介绍RAG应用场景及相关技巧
大模型RAG搭建(30分钟)
1、LangChain框架及概念介绍
搭建大模型RAG
大模型企业落地案例解析(60分钟)
1、大模型企业落地场景介绍,包括智能问答、知识库、知识图谱于大模型融合案例等
2、大模型应用落地案例分享
答疑与交流(30分钟)