概念
Assistants API(助手API)是OpenAI提供的一套API,方便开发者可以使用代码的方式创建自定义AI助手。
允许接入三种不同类型的 tools:
- 代码解释器(Code Interpreter)
- 检索,知识库集成(Retrieval)
- 函数调用(Function calling)
通过构建 AI 助手,用户可以通过指令(instructions)设置助手的角色和能力。然后,AI 助手将利用其强大的大语言模型能力、各种工具(tools)和知识库来回答用户的问题。
GPTs 是什么
- GPTs 是 OpenAI 提供的可以在平台网页上快速创建定制版的ChatGPT(即自定义聊天机器人)的功能。
构建一个完整的GPTs应用
登陆 OpenAI 网站,选择 Explore,然后再 My GPTs 中选择 create a GPTs.
有两种方式可以进行GPTs 的创建:
- 通过对话的方式进行,选择 Create
- 通过配置的方式进行,选择 Configure
只需要将需要的配置进行设置,就能得到一个想到的GPTs的能力。
- Web Browsing:网页浏览能力
-
Code Interpreter:代码编写以及执行能力
下图是这个数据分析助手的一个demo情况,用户可以在两三分钟内快速实现一个AI助手。
Assistants API 集成
用户可以通过Assistant playground 进行Assistants API 的探索,参考以下教程使用 API 进行 AI Assistant 集成。
通常进行 Assistants API 集成需要一下四个步骤:
- 首先创建一个AI助手 (Assistant)。
- 通过自定义指令(custom instructions)进行 AI 助手能力定义,实现 AI 助手的形象和能力定位。
- 选择基础模型,可以选择 GPT-3.5、GPT-4 等作为基础模型。
- 选择扩展能力 tools 例如 code interpreter, retrieval 以及其他的 function call 工具。
已有能力:
- 创建和管理 assistant,每个 assistant 有独立的配置
- 支持无限长的多轮对话,对话历史保存在 OpenAI 的服务器上
- 通过自有向量数据库支持基于文件的 RAG
- 支持 Code Interpreter
- 在沙箱里编写并运行 Python 代码
- 自我修正代码
- 可传文件给 Code Interpreter
- 支持 Function Calling
- 支持在线调试的 Playground
承诺未来会有的能力:
- 支持 DALL·E
- 支持图片消息
- 支持自定义调整 RAG 的配置项
收费:
- 按 token 收费。无论多轮对话,还是 RAG,所有都按实际消耗的 token 收费
- 如果对话历史过多超过大模型上下文窗口,会自动放弃最老的对话消息
- 文件按数据大小和存放时长收费。1 GB 向量存储 一天收费 0.10 美元
- Code interpreter 跑一次 $0.03
大模型典型的商业应用:
1、智能体越来越多
2、大语言模型在解决业务上单点问题效果非常好:客服的对话分析。
Assistants API是OpenAI去年11月份发布的(封装的云接口,集成了更多能力),主要是弥补原生API有很多不足:如RAG功能需要自己开发,如不方便做三方接口封装等。
GPTs的作用:可以不用写代码,在GPT Store里快速配置搭建一个GPT给客户演示,或搭建原型验证功能可行性。
1、GPTs是基于网页操作,可以快速搭建自定义GPT(自定义机器人)
2、如果要进行深度开发,需要用到Assistants API(内部封装了RAG、Function等)
OpenAI其实给了应用开发者更大的空间
1、更多技术路线选择:原生API、GPTs 和 Assistants API
2、想要极致调优,还得原生 API + RAG
做一个自己的GPT
需求:
1、能对话
2、可以查询自己的数据库
3、用文件做知识库
方式1:通过网页创建(platform.openai.com/assistants)
方式2:通过代码创建
GPTs与智能体的区别
智能体更加复杂:不光是判断当前调用什么函数,他把一个工作拆成多个步骤,然后一步一步去执行。
GPTs与Playground区别
GPTs偏向于用户,可以快速配置一个GPT
Playground偏开发(模拟代码调用),可以调试开发的一些细节,和查看日志,是Assistants API的界面调试工具。