多模态感知与智能Agent系统开发实战-精品课程-软件研发管理培训、咨询服务-MSUP

HiroTan

某公司多模态大模型负责人

老师是国内一线的人工智能和大模型算法专家。某公司，多模态大模型负责人，多年行业算法工作经验，专注于机器学习与大模型落地实践；对于国产芯片的大模型落地有丰富的实践经验，实战经验覆盖C端产品、B端产品、与硬件大模型落地方案。在技术层面，老师尤为擅长围绕人工智能领域的全线技术，研究方向包括多模态大模型，端侧边缘计算等。
曾任百度集团算法专家；

课程简介

本课程深入探讨多模态AI与智能Agent的前沿技术与实践应用。课程将系统性地介绍多模态模型的核心原理、最新发展趋势，以及如何构建具有多模态感知能力的智能Agent系统。通过理论讲解与实战案例相结合的方式，学员将掌握如何整合视觉、语言等多种模态信息，开发具有深度理解与决策能力的Agent系统。课程特别关注实际应用场景，包括多模态对话系统、智能助手开发、场景理解与交互等领域的具体实现方法。通过动手实践环节，学员将学习到最新的技术框架与开发工具，掌握从需求分析到系统部署的完整开发流程。

目标收益

培训对象

课程内容

第一部分：
Agent 技术前沿：从 LLM 到自主智能体Agent协议基础与架构
1，从语言模型到自主 Agent 的技术跃迁
2，Agent 的认知架构与核心能力模型
3，工作链编排与 ToolUse 能力
4，MCP 协议与工具调用标准化
5，自主规划与决策能力的技术实现
6，主流 Agent 框架对比：LangGraph、AutoGPT、CrewAI
多Agent 系统与协作机制
1，多 Agent 协作体系架构设计
2，Orchestrator-workers 架构与复杂任务分解
3，工作流模式与任务编排
4，多 Agent 通信协议与冲突解决机制
5，基于 MCP 的企业内部系统集成方案
6，OWL/OpenManus 框架实践
Agent RAG 与企业知识应用实战
1，DeepSeek 推理能力与 RAG 的融合
2，GraphRAG 技术原理与知识图谱的结合
3，Agent 驱动的企业知识库应用架构
4，基于 Agent 的复杂问答系统设计
5，搜索 Agent 的实战经验对比

第二部分：多模态技术
多模态大模型技术与架构
1，视觉-语言多模态模型架构：CLIP、GPT-4V、Gemini
2，DeepSeek 多模态模型的技术特点与应用场景
3，特征融合与多模态对齐技术
4，跨模态检索与推理技术实现
5，视频理解与长时序多模态处理
6，多模态 Agent 的感知与决策能力实现
私有化部署生成技术与创意应用
1，图像生成技术的演进：从 GAN 到扩散模型
2，Flux、ComfyUI 工具与框架实践
3，视频生成与虚拟人技术应用
4，语音合成与 TTS 技术在产品中的应用
5，多模态内容生成控制与质量优化策略

多模态感知与智能Agent系统开发实战

HiroTan

某公司多模态大模型负责人

课程费用

6800.00 /人

课程时长

3小时

课程简介

目标收益

培训对象

课程内容

课程评论

课程费用

6800.00 /人

课程时长

3小时

近期公开课推荐

近期公开课推荐

Spec Coding 实战训练营：AI 辅助编码与智能评审

AI 大模型时代的 FDE 转型实战：从业务场景到智能体交付

AI 大模型时代的 FDE 转型实战：从业务场景到智能体交付

多模态感知与智能Agent系统开发实战

HiroTan

某公司 多模态大模型负责人

课程费用

6800.00 /人

课程时长

3小时

课程简介

目标收益

培训对象

课程内容

课程评论

课程费用

6800.00 /人

课程时长

3小时

近期公开课推荐

近期公开课推荐

Spec Coding 实战训练营：AI 辅助编码与智能评审

AI 大模型时代的 FDE 转型实战：从业务场景到智能体交付

AI 大模型时代的 FDE 转型实战：从业务场景到智能体交付

某公司多模态大模型负责人