课程介绍
【培训背景】
随着科技的飞速发展,人工智能(AI)已成为引领新一轮科技革命和产业变革的重要驱动力。大模型(Large Language Models, LLMs)作为AI领域的一项革命性突破,正以前所未有的速度重塑着我们对智能交互、知识管理、内容创作乃至整个数字化世界的认知。近年来,诸如GPT系列、Sora等大模型的不断涌现,不仅展示了AI在自然语言处理领域的巨大潜力,也预示着AI技术即将迈入一个更加复杂、细腻且广泛适用的新纪元。
人工智能成为全球焦点的背景下,2024年中国政府工作报告,就首次提出开展“人工智能+”行动,相信后续还有更多利好人工智能和“人工智能+”的政策即将释放。而在国家层面推动“AI+”行动,无数的机会也将井喷。
【培训收益】
整体掌握大模型理论知识及核心技术
掌握图像生成和应用实操
掌握DeepSeek与ChatGPT等原理与实战
精通大模型私有化部署、API开发实操
掌握Dify、LangChain等框架落地应用方法
掌握OpenClaw部署、多Agent协同
具备大模型企业商用项目从设计到落地的实战能力
【适合人群】
从事人工智能领域工作的人
如果你正在从事人工智能、机器学习、数据分析等相关领域的工作,或者想要进入这些领域,那么学习AI大模型开发将会对你的职业发展有很大的帮助。
软件工程师和架构师
这类专业人士可以通过学习AI大模型开发课程来提升团队的研发效率,了解大模型如何影响软件架构,并掌握基于大模型的全新开发范式。
对人工智能有浓厚兴趣的人
对人工智能、机器学习等领域有浓厚的兴趣,想要深入了解并掌握相关技能,并有一定的软件开发基础的从业者。
【培训特色】
1.资深讲师授课,小班制教学;
2.理论与实践相结合、案例分析与行业应用穿插进行;
3.专家精彩内容解析、学员专题讨论、分组研究。
【授课专家】
邹老师 | 长春工业大学人工智能研究院院长
工程学术带头人、华东建筑设计研究总院研究员、山东交通学院客座教授、南昌航空大学硕士生导师、中国软件行业协会专家委员、上海市计划生育科学研究所特聘专家、天津大学创业导师、中华中医药学会会员、中国医药教育协会老年运动与健康分会学术委员;领导睿客邦与全国二十多所高校、国企建立了AI联合实验室,完成50多个深度学习实践项目,广泛应用于医疗、交通、农业、气象、银行、电信等多个领域。
带队完成了数十个AI项目,内容不仅包括深度学习、机器学习、数据挖掘等具体技术要点,也包括AI的整体发展、现状、应用、商业价值、未来方向等,涵盖内容非常丰富。
刘老师 国内顶尖AI专家 | 中培特聘专家
拥有十几年软件研发经验,十年企业培训经验,对Java、Python、区块链等技术领域有独特的研究,精通J2EE企业级开发技术。Java方向:设计模式、Spring MVC、MyBatis、Spring、StringBoot、WebService、CXF并且对Java源码有深入研究。Python方向:Python OOP、Mongodb、Django、Scrapy爬虫、基于Surprise库数据推荐,Tensorflow人工智能框架、人脸识别技术。区块链方向:BitCoin、Solidity、Truffle、Web3、IPFS、Hyperledger Fabirc、Go、EOS。
【结业证书】
参加培训并通过考试学员,由工业和信息化部教育与考试中心统一颁发《AI大模型全栈技术(高级)》工业和信息化职业能力证书。


证书样本
开班计划
| 开课时间 | 授课形式 | 培训类型 | 上课城市 | 在线报名 |
|---|---|---|---|---|
| 2026-05-26 | 面授+直播 | 精品班 | 成都 | 在线报名 |
| 2026-08-25 | 面授+直播 | 精品班 | 北京 | 在线报名 |
| 2026-10-27 | 面授+直播 | 精品班 | 重庆 | 在线报名 |
| 随报随学 | 录播 | 特惠班 | IT云课 | 在线报名 |
课程大纲
AI大模型全栈工程师实战培训班,标准公开课为3天,每天6小时,录播课为15课时,企业内训可按需求定制。
课程安排如下:
日程 | 培训主题 | 培训大纲 |
第一天 上午 | 第一节: 大模型理论知识 (预备知识) | 1. 初探大模型:起源与发展 2. GPT模型家族:从始至今 3. 大模型DeepSeek VS ChatGPT4的对比介绍 4. 大模型实战-讲解大模型2种学习路线 5. 大模型最核心的三项技术:模型、微调和开发框架 6. DeepSeek的MoE混合专家模型介绍 7. DeepSeek-R3后训练阶段与强化学习技术介绍 8. OpenAl文本模型A、B、C、D四大模型引擎简介 9. 最强Embedding大模text-Embedding-ada模型介绍 10. 全球开源大模型性能评估榜单 11. 中文大模型生态介绍与GLM 130B模型介绍 12. DeepSeek模型介绍与部署门槛 13. DeepSeek开源生态:微调、多模态,WebUI等项目简介 |
第二节:DeepSeek 大模型API应用开发 | 1. DeepSeek-V3 大模型API 2. DeepSeek模型&价格 3. DeepSeek模型参数Temperature设置 4. DeepSeek模型Token用量计算 5. DeepSeek大模型多轮对话 6. DeepSeek大模型JSON Output 7. DeepSeek大模型Function Calling 8. DeepSeek大模型上下文硬盘缓存 9. 聊天机器人初探(Chat Completion) 10. 基于DeepSeek开发智能翻译助手 | |
第一天 下午 | 第三节: LLM模型的私有化部署与权限控制 | 1. 各种模型文件介绍:.bin、GGUF、.safetensors等格式区别 2. 模型的推理、量化原理与实现流程 3. ModelScope与Hugging Face平台介绍及模型下载使用 4. 大模型管理底座Ollama架构与运行机制 5. Ollama+LLaMA部署开源大模型的完整流程 6. Open WebUI前端功能介绍与模型调用演示 7. Open WebUI用户与访问权限控制配置方法 8. vLLM架构简介与Ollama的核心区别 9. vLLM在高并发与吞吐性能上的优化机制解析 10. vLLM+OpenAPI实战:部署并调用企业级大模型服务 |
第四节:Dify本地化构建智能客服 工作流 | 1. 智能体介绍与Dify基本原理 2. Dify安装与环境配置 3. Dify在智能应用中的角色与优势 4. 智能体的组成:Prompt、数据源、模型、工具集成 5. Dify与LangChain、Flowise等工具的对比 6. 实战体验:Dify实现数据爬取、清洗、保存 7. 创建各种场景的智能:数据分析、代码编写、客服 8. Dify如何关联本地模型 9. Dify的API调用与微信连接实现 | |
第二天 上午 | 第五节: 基于Deepseek和LangChain构建Agent | 1. 通过LangChain中的ReAct框架实现自动定价 2. LangChain ReAct框架 3. LangChain中ReAct Agent的实现 4. LangChain中的工具和工具包 5. 通过create_react_agent创建Agent 6. 深挖AgentExecutor的运行机制 7. Plan-and-Solve策略的提出 8. LangChain中的Plan-and-Execute Agent 9. 通过Plan-and-Execute Agent实现物流管理 10. 为Agent定义一系列进行自动库存调度的工具 |
第六节:Agent+MCP打造高级智能体 | 1. RAG、Agent与MCP的区别与联系 2. MCP与FunctionCall的关系 3. 热门的MCP客户端工具有哪些 4. MCP服务接入原理讲解 5. 自定义MCP Client开发--STDIO协议对接 6. LangGraph agent接入Github MCP服务 7. Langchain_mcp_adatpers创建高德MCP客户端 8. 基于高德MCP的复杂路径规划+可视化展示 | |
第二天 下午 | 第七节: 基于DeepSeek 和LlamaIndex构建文档问答系统
| 1. LlamaIndex:选择与配置不同的语言模型与向量模型 2. LlamaIndex提示:定义与管理查询模板及上下文注入策略 3. LlamaIndex索引:构建文档索引、向量索引与树形索引 4. LlamaIndex存储:访问与持久化外部知识数据 5. LlamaIndex记忆:实现对多轮对话的上下文追踪与复用 6. LlamaIndex代理:整合外部工具与执行动态任务 7. 实战演练:使用LlamaIndex构建企业文档问答系统 |
第八节:Trae AI 驱动:Skills插件 极速开发
| 1. Trae 开发环境快速搭建 2. AI自然语言生成Skill代码 3. URL转二维码功能极速构建 4. 智能邮件管理插件开发实战 5. Trae智能诊断与代码修复 6. AI辅助对接多平台API接口 7. 自动化办公爬虫编写实操 8. 多项Skill逻辑链条组合集成 9. 插件标准化封装与运行测试 | |
第三天 上午 | 第九节: OpenClaw的部署与使用 | 1. OpenClaw基础部署与环境准备 2. OpenClaw核心配置文件详解 3. 模型供应商(Model Provider)集成 4. 基础对话(Chat)与角色设置 5. 简单工具(Tools)的挂载与测试 6. Skills安装使用及技巧 7. 意图识别与任务匹配 8. 配置多Agent子Agent 9. Agent多任务协同的配置与调用 |
第十节: 从图片、视频到数字人,AI应用边界探索
| 1. 用Stable Diffusion实现文生图(输入文字就能画图) 2. 用Stable Diffusion实现图生图(上传图片自动变换风格) 3. 提示词怎么写?掌握关键词技巧 4. 玩转Lora微调,让图片拥有不同风格(动漫、国风、写实) 5. 艺术字、证件照、logo、海报、详情图制作实操 6. AI辅助设计,快速搞定海报、Banner、广告图 7. 认识HeyGen,AI数字人生成工具 8. 用HeyGen生成数字人大纲、剧本、字幕、配乐 9. 一键制作真人感十足的数字人视频 10. 实现AI半无人直播、语音直播,应用到客服和营销 | |
第三天 下午 | 第十一节:DeepSeek多模态模型Janus的微调与模型对齐 | 1. 多模态大模型的核心原理与应用场景 2. 报销凭证(发票、单据)的结构化特征与难点 3. 数据准备:票据样本、文字识别与表格标注 4. 如何科学构建训练数据(基础与专业数据混合训练) 5. 微调常见方式介绍:微调、偏好对齐、蒸馏、奖励模型 6. OCR微调:关键字段识别(抬头、金额、日期、税号) 7. 版式与图像理解:复杂票据结构解析 8. 多模态信息对齐:文本、图像与语音的融合 9. 参数高效微调方法(LoRA/Adapter)实战 10. 案例演示:凭证识别与结构化信息提取 11. 业务落地:从票据识别到自动化报销流程 |
第十二节:EvalScope实现模型评估 | 1. EvalScope架构与LLM模型评估全生命周期 2. 评估实战:评测流程与结果可视化 3. 评估指标设计与结果的高效对比分析 4. 主流大模型框架的集成方式 5. 评估结果的结构化存储与复现机制 6. 评估版本管理:模型、数据集与评测配置关联 7. EvalScope的自动化评估与人工反馈结合机制 8. EvalScop中的Prompt评估与提示词版本对比 9. EvalScope的评估可观测性与评测链路追踪 10. 基于EvalScope评估结果的模型部署与上线决策 |