课程简介:
每当有新技术突破的时候,最流行的句式是“所有业务都可以用XX实现一遍”。AI大模型的突破,让所有人再次跃跃欲试。作为工程师,我们有机会站在驱动业务重构的最前沿,这里面有巨大的机会。在以传统机器学习为代表的类AI阶段,大家在技术层面往往会陷入语言/库之争,Python作为AI的门面语言,受到了极大关注,但同时也让非Python的工程师陷入两难:我要放弃现有的技术栈么?大模型的突破,让这一切不是问题。首先,AI大模型在应用层,API极为简单,对于有其他语言经验的工程师来讲并非难事。其次,过去的机器学习等知识体系,在大模型时代已没有特别大的必要去深入了(当然,了解更好)。过去在了解部分底层算法的前提下做调参,而现在调好prompt就可以了(当然,要用好它也不容易)。最后呢,目前各家语言平台都在快速跟进对AI的支持,比如Java方面,SpringAI提供了对AI Agent开发的支持。整体来说,AI产品开发和传统产品开发,最核心的点是:设计/开发/测试模式的变化。要理解这一点,必需先了解AI大模型本身的特点,及周边的生态。
那么,既然AI大模型的应用门槛不高,我们工程师该怎样基于AI构建自己的最核心竞争力,拓宽技术护城河,并持续赋能业务呢?这是我们本次课程的目标。
本次课程将从AI大模型行业现状、行业典型案例及实现、AI发展路线图、基于Copilot/Cursor等智能编码工具的研发效能提升、大模型核心逻辑、Prompt工程及调优、大模型应用开发、开源大模型微调流程等多个方面,从概念+实践的角度去学习最前沿的AI知识,从0打造AI时代的全栈护城河。
培训对象
1、适合想进入AI领域,或者利用AI提升工作效能的工程师。
2、适合想开发AI产品,或者使用开源大模型构建垂直业务模型的工程师。
3、适合想更全面判断AI趋势、或者利用AI为现有业务赋能的技术管理者。
课程时长:2天
课程大纲
主题授课内容
引子AI大模型通识、生态与发展;Prompt工程与应用、AI Agent应用开发、开源大模型微调与推理等
第一单元:AI大模型通识
该单元主要介绍AI大模型概念、生态、以及当前发展情况。1. AI大模型通识
1.1 大模型的定义与特点
1.2 大模型的分类与应用
1.3 大模型的底层工作原理
1.4 开源 vs 闭源大模型
1.5 Token模式与定价
2. AI大模型生态及发展
2.1 国内外主流大模型介绍
2.2 AI+赋能场景案例介绍
第二单元:Prompt应用、模式与工程
该单元主要讲解大模型的核心逻辑、Prompt/API工程实践3. Prompt工程与实践
3.1 Prompt核心要素与案例
3.2 Prompt常见思维框架
3.3 如何理解思维链 vs 思维树
3.4 Prompt的攻击/安全问题
3.5 Prompt工程≈软件工程
第三单元:AI与工程师
该单元主要介绍目前最前沿的智能编码模型与工具,软件工程师如何使用基于Agent模式编码工具进行生产提效。
4. 编码大模型与工具
4.1 智能编码目前包含哪些能力
4.2 常见智能编码模型(Codex、DeepSeek Coder、CodeLlama等)
4.3 Agent模式下的Copilot/Cursor/Trae应用
4.4 AI辅助下的全栈开发工作流
5. AI重塑产/研/测
5.1 AI与产品经理
5.2 AI与研发工程师
5.3 AI与测试工程师
第四单元:AI Agent应用开发实战
该单元主要介绍目前最常见的Agent应用开发模式、框架与落地应用。6. AI Agent工程与案例
6.1 Agent应用模式与架构
6.2 案例:斯坦福小镇
7. Agent应用开发实践
7.1 快速实现一个Chat程序
7.2 核心参数列表
model参数
角色与指令
7.3 实现多轮对话
7.4 Function Calling机制
7.5 实现智能订餐助手
7.6 数据与函数准备
7.7 工具(函数)调用
7.8 缓解幻觉问题
8. 大模型开发框架LangChain
8.1 LangChain介绍
8.2 LangChain概念与组件
8.3 LangChain安装与配置
8.4 LangChain表达式语言:LCEL
8.5 LangServe服务部署
8.6 使用LangChain构建数据分析Agent
8.7 使用LangGraph构建/编排复杂Agent工作流
9. 从零搭建基于知识库的智能客服系统
9.1 知识库是什么?
9.2 理解RAG与Embedding
9.3 向量数据库与语义检索
9.4 搭建企业智能客服系统
第五单元:开源大模型及微调/推理方案
该单元主要介绍目前市面上主流的开源大模型方案,如Llama3、ChatGLM、DeepSeek、Qwen等。10. 开源大模型:垂直模型的基座
10.1 开源大模型串讲:Llama3、ChatGLM3/4、Qwen、DeepSeek
10.2 快速搭建本地开源模型环境(ollama+openwebui)
10.3 Hugging Face:AI界的Github
10.4 开源微调:构建基于垂直行业的私有大模型(基于PEFT/LoRA)
10.5 基于vLLM搭建模型推理服务
10.6 基于开源模型构建Agent应用
10.7 延展:GPU/显卡、LPU推理引擎等交付资源选型。