课程介绍
【培训背景】
2025年春节期间中国的DeepSeek火爆全球,震惊美国硅谷,可以与花费百亿巨资的GPT相媲美,戳穿美股科技泡沫,以英伟达为代表的AI龙头出现了暴跌。DeepSeek让特朗普也感到惧怕,随即美国黑客攻击DeepSeek的网站,使其瘫痪,中美爆发网络黑客大战。DeepSeek的爆火源于其多方面优势。首先,它完全开源,可本地部署,无使用限制,保护用户隐私。其次,其性能强大,效果可比肩甚至超越国际顶尖模型,尤其在中文处理和复杂逻辑推理方面表现出色。此外,DeepSeek训练成本低,API价格仅为同类产品的三十分之一,性价比超高。它还支持深度思考,能展示清晰的思维链,并具备联网搜索、拍照识字、文件上传等功能,使用场景丰富。最后,其响应速度快,生成内容几乎无需等待。
【培训收益】
提供清晰全面的可用知识,快速了解DeepSeek和API;
对比OpenAI和国内多个其他大模型(文心,智谱,千问等)的工作原理及优势;
在案例基础上使用流行的编程语言构建大模型应用;
掌握如何构建文本生成、问答和内容摘要等初阶大模型应用;
了解提示工程、模型微调、插件、LangChain,RAG,Agent等高阶实践技术。
【适合人群】
程序员、开发工程师、软件设计师、项目经理、架构师等。
本课程面向零基础LLM应用开发者,不需要了解复杂数学算法,机器学习原理,不需要之前学习过大模型知识。有Java,C#,C++等编程基础,最好有Python基础知识,但即使你对 Python 不太熟悉,也完全没有关系。课程主要阅读和讲解案例代码。
【培训特色】
1.资深讲师授课,小班制教学;
2.理论与实践相结合、案例分析与行业应用穿插进行;
3.专家精彩内容解析、学员专题讨论、分组研究。
【授课专家】
刘老师 | 国内顶尖AI专家
最近几年带队完成了数十个AI项目,内容不仅包括深度学习、机器学习、数据挖掘等具体技术要点,也包括AI的整体发展、现状、应用、商业价值、未来方向等,涵盖内容非常丰富。完成多个深度学习实践项目,广泛应用于医疗、交通、银行、电信等多个领域。从2020年推出的多门课程《AI大模型赋能行业应用与解决方案》《AI大模型辅助软件研发管理与效能提升》和《AI大模型技术及开发应用实践》更是广受欢迎,已经为几十家企业培训,作为一名AI技术专家,对人工智能的理解深入透彻。他不仅精通AI的编程技术,还熟悉各种AI工具的使用,尤其在AI行业应用更是有着独特的见解和实践经验;自从2023年以来帮助多家研发中心做AI辅助开发效能提升咨询服务。同时也是微软人工智能认证工程师,阿里云AI人工智能训练师。在人工智能领域的深耕和创新,也得到了出版社的青睐,计划出版自己的著作。也在多家技术大会做AI技术讲座。
【结业证书】
参加培训并通过考试的学员,由中国信息化培训中心颁发《DeepSeek大模型应用开发高级工程师》职业技能培训证书,此证书不仅是对学员学习成果的高度认可,更是学员在AI技术领域专业能力的有力证明,为学员的职业发展增添重要砝码。
证书样本
开班计划
开课时间 | 授课形式 | 培训类型 | 上课城市 | 在线报名 |
---|---|---|---|---|
2025-03-24 | 面授+直播 | 精品班 | 北京 | 在线报名 |
随报随学 | 录播 | 特惠班 | IT云课 | 在线报名 |
课程大纲
DeepSeek大模型应用开发最佳实践培训班,标准公开课3天,每天6小时,企业内训可按需求定制。
课程安排如下:
章节 | 内容 | 详情 |
第一章 DeepSeek大模型原理和应用 | 第一部分: LLM大模型核心原理 | 1. 大模型基础:理论与技术的演进 |
2. LLMs大语言模型的概念定义 | ||
3. LLMs大语言模型的发展演进 | ||
4. LLMs大语言模型的生态体系 | ||
5. 大语言模型技术发展与演进 | ||
6. 基于统计机器学习的语言模型 | ||
7. 基于深度神经网络的语言模型 | ||
8. 基于 Transformer 的大语言模型 | ||
9. LLMs大语言模型的关键技术 | ||
10. LLMs大语言模型的核心框架:商业&开源 | ||
11. LLMs大语言模型的行业应用 | ||
第二部分: DeepSeek大模型应用-办公提效 | 1. 官方大模型DeepSeek应用 | |
2. DeepSeek办公提效 | ||
3. 使用DeepSeek官方模型做推理任务 | ||
4. DeepSeek和OpenAI O1模型的对比总结 | ||
5. DeepSeek和国内其他大模型对比(智谱,文心,通义,kimi等) | ||
6. DeepSeek和国外其他大模型对比(Claude Gemini Mistral等) | ||
第三部分: DeepSeek大模型推理能力 | 1. DeepSeek-R1 发布 | |
2. 对标 OpenAI o1 正式版 | ||
3. DeepSeek-R1 上线 API | ||
4. DeepSeek 官网推理与 App | ||
5. DeepSeek-R1 训练论文 | ||
6. 蒸馏小模型超越 OpenAI o1-min | ||
7. DeepSeek-R1 API 开发应用 | ||
8. 通用基础与专业应用能力 | ||
第二章 基于DeepSeek大模型API开发应用 | 第一部分:DeepSeek大模型与Prompt提示工程 | 1. Prompt如何使用和进阶 |
2. 什么是提示与提示工程 | ||
3. 提示工程的巨大威力:从Let’s think step by step说起 | ||
4. 拆解、标准化、流程化:如何用AI改造工作 | ||
5. 使用BROKE框架设计ChatGPT提示 | ||
6. 通过案例分析,展示如何使用大模型prompt技术辅助开发 | ||
第二部分: DeepSeek大模型 API 应用开发 | 1. DeepSeek-V3 大模型API | |
2. DeepSeek-R1推理大模型API | ||
3. DeepSeek模型 & 价格 | ||
4. DeepSeek模型参数Temperature 设置 | ||
5. DeepSeek模型Token 用量计算 | ||
6. DeepSeek模型错误码 | ||
7. DeepSeek大模型多轮对话 | ||
8. DeepSeek大模型对话前缀续写(Beta) | ||
9. DeepSeek大模型FIM 补全(Beta) | ||
10. DeepSeek大模型JSON Output | ||
11. DeepSeek大模型Function Calling | ||
12. DeepSeek大模型上下文硬盘缓存 | ||
13. 文本内容补全初探(Text Completion) | ||
14. 聊天机器人初探(Chat Completion) | ||
15. 基于DeepSeek开发智能翻译助手 | ||
16. 案例分析 | ||
第三部分: DeepSeek大模型对比其他大模型API(国外和国内其他) | 1. OpenAI大模型API | |
2. claude大模型API | ||
3. Gemini 大模型API | ||
4. 智谱大模型API 介绍 | ||
5. 使用 GLM-4 API构建模型和应用 | ||
6. 基于通义千问大模型API的应用与开发 | ||
7. 基于百度大模型API应用开发 | ||
8. 基于字节,腾讯,华为大模型应用开发 | ||
第四部分: DeepSeek大模型API构建应用程序(12案例,灵活选择) | 1. 应用程序开发概述 | |
2. 案例项目分析 | ||
3. 项目1:构建新闻稿生成器 | ||
4. 项目2:语音控制 | ||
5. 项目3:企业管理系统MIS应用案例分析 | ||
6. 项目4:某企业智能管理系统 | ||
第三章 DeepSeek和LangChain开发应用
| 第一部分: 大模型应用开发框架 LangChain | 1. 大模型应用开发框架 LangChain |
2. LangChain 是什么 | ||
3. 为什么需要 LangChain | ||
4. LangChain 典型使用场景 | ||
5. LangChain 基础概念与模块化设计 | ||
6. LangChain 核⼼模块入门与实战 | ||
7. LangChain 的3 个场景 | ||
8. LangChain 的6 大模块 | ||
9. LangChain 的开发流程 | ||
10. 创建基于LangChain聊天机器人 | ||
第二部分: 基于DeepSeek和LangChain构建文档问答系统 | 1. 构建复杂LangChain应用 | |
2. LangChain模型(Models):从不同的 LLM 和嵌入模型中进行选择 | ||
3. LangChain提示(Prompts):管理 LLM 输入 | ||
4. LangChain链(Chains):将 LLM 与其他组件相结合 | ||
5. LangChain索引(Indexs):访问外部数据 | ||
6. LangChain记忆(Memory):记住以前的对话 | ||
7. LangChain代理(Agents):访问其他工具 | ||
8. 使用大模型构建文档问答系统 | ||
第四章 DeepSeek构建企业级RAG知识库 | 第一部分: DeepSeek大模型企业RAG应用 | 1. RAG技术概述 |
2. 加载器和分割器 | ||
3. 文本嵌入和 向量存储 | ||
4. 检索器和多文档联合检索 | ||
5. RAG技术的关键挑战 | ||
6. 检索增强生成实践 | ||
7. RAG技术文档预处理过程 | ||
8. RAG技术文档检索过程 | ||
第二部分: 构建基于DeepSeek RAG Agent:实现检索增强生成 | 1. 何谓检索增强生成 | |
2. 提示工程、RAG与微调 | ||
3. 从技术角度看检索部分的Pipeline | ||
4. 从用户角度看RAG流程 | ||
5. RAG和Agent | ||
6. 通过Llamalndex的ReAct RAG Agent实现检索 | ||
7. 获取井加载电商的财报文件 | ||
8. 将财报文件的数据转换为向量数据 | ||
9. 构建查询引擎和工具 | ||
10. 配置文本生成引擎大模型 | ||
11. 创建Agent以查询信息 | ||
第五章 基于DeepSeek大模型Agent智能体开发 | 第一部分:DeepSeek大模型驱动的Agent智能体开发概述 | 1. 智能体的定义与特点 |
2. 智能体与传统软件的关系 | ||
3. 智能体与LLM的关系 | ||
4. 从ChatGPT到智能体 | ||
5. 智能体的五种能力 | ||
6. 记忆,规划,工具,自主决策,推理 | ||
7. 多智能体协作 | ||
8. 企业级智能体应用与任务规划 | ||
9. 智能体开发 | ||
第二部分: 基于Deepseek和LangChain构建Agent | 1. 通过LangChain中的ReAct框架实现自动定价 | |
2. LangChain ReAct框架 | ||
3. LangChain中ReAct Agent 的实现 | ||
4. LangChain中的工具和工具包 | ||
5. 通过create_react_agent创建Agent | ||
6. 深挖AgentExecutor的运行机制 | ||
7. Plan-and-Solve策略的提出 | ||
8. LangChain中的Plan-and-Execute Agent | ||
9. 通过Plan-and-Execute Agent实现物流管理 | ||
10. 为Agent定义一系列进行自动库存调度的工具 | ||
第六章 DeepSeek深入学习 | 第一部分: DeepSeek原理和优化 | 1. DeepSeek原理剖析 |
2. DeepSeek系统软件优化 | ||
3. DeepSeek 训练成本 | ||
4. DeepSeek V3模型参数 | ||
5. DeepSeek MoE架构 | ||
6. DeepSeek 架构4方面优化 | ||
7. DeepSeek R1 论文解读 | ||
8. DeepSeek R1的创新点剖析 | ||
9. DeepSeek R1 引发的创新思考 | ||
第二部分: 私有化部署DeepSeek推理大模型 | 1. DeepSeek云端部署 | |
2. DeepSeek和国产信创平台 | ||
3. DeepSeek和国内云平台 | ||
4. 利用Ollama私有化部署DeepSeek R1大模型 | ||
5. 一键部署DeepSeek R1大模型 | ||
6. DeepSeek R1私有化部署总结 | ||
第三部分: DeepSeek大模型微调 | 1. DeepSeek 大模型微调 | |
2. 为何微调大模型 | ||
3. 大模型先天缺陷 | ||
4. 预训练成本高昂 | ||
5. 垂直数据分布差异 | ||
6. 提示推理成本限制 | ||
7. DeepSeek大模型微调的三个阶段剖析 | ||
8. DeepSeek大模型微调的两种方法剖析 |