AI Agent(人工智能代理)是一种能够感知环境、进行决策和执行动作的智能实体。 AI Agent也可以称为“智能体”,也可理解为“智能业务助理”,指在大模型技术驱动下,让人们以自然语言为交互方式高自动化地执行和处理专业或繁复的工作任务,从而极大程度释放人员精力。
如果说大模型是电池:核心能力
那么agent就是一辆电动车:最终交付,最终产品
Agent的缺点:
1.依赖大模型的核心能力,大模型本身够强才行
2.链路过长,某一环节出错,前功尽弃
3.多次调用模型,效率不高
4.迁移能力弱,换模型需要重新写提示词5.能力强弱,取决于写提示词的水平
大模型能力是有上限的端到端虽然理想,但是复杂问题很难解决Agent这种拆解形式,会更加流行
举个例子,AI Agent 就像是一个更加智能的小爱同学,当你生病的时候,你对它说:“小爱同学,我身体有些不舒服。”
它就会通过监测你的体温和其他身体指标,并结合互联网上的数据和信息,通过缜密的分析,给出一个结论:你阳了。然后主动给你生成了请假条,你只要点点头就会直接发给你领导。
而且它还感知到,家里的布洛芬不够了,就顺手把药品加入购物车,只要你确定就可以付款,15分钟后就会送到门口。
Agent:大白话就是给大模型加外挂
1.外挂辅助输入(今天北京的天气如何)外部调用日历:2023-10-17
2.外挂输出:日期:2023-10-17,目标:天气,调用工具:气象接口
AI Agent 专业词汇主要分为4个部分:
- 感知(Perception)
这是流程的第一步。AI 通过传感器、摄像头、麦克风等硬件,初步建立起对外部世界的感知。
输入(Inputs):感知到的信息被输入到系统中。以上面的例子来说,“我有点不舒服”,这句话就被收音模块收集,并输入到系统中。
外部环境(Environment):系统所在的环境或上下文。比如“我有点不舒服”这件事,会涉及到天气、环境等。 - 信息处理(Brain)
可以理解成通用大模型+N多个专业的知识库,用来处理信息。包含以下系统:
1)信息存储相关
记忆系统:包括Storage和Memory,用来存储长期和短期的数据。
比如长期数据是我这个人的基本信息、基础疾病等;
短期数据比如我家的布洛芬没有了。
知识库(Knowledge):包括医学知识库等,可以根据我的症状诊断我当前的状态,以及后续治疗。
2)大模型对信息进行处理
基于感知的信息(input + Environment)、记忆、知识库等信息,进行加工处理,得出结论(Decision Making):“我阳了”。
3)然后制定下一步计划(Planning)。
Action/Reasoning 是基于其决策的具体动作,但还没有实行。
要帮我写好请假条、帮我买药等。 - 执行(Action)
基于 Barin 一系列眼花缭乱的操作,得出了结论,制定了下一步计划,那就需要执行(Action)。
但是大模型本身是不能完成这些任务,这时候就会用调用第三方的工具(Tools 和Calling API),通过接口或者应用,与其他App进行互动,从而达到最终效果。 - 输出(output)
执行之后,会告诉你执行结果。比如小爱同学告诉你:“你阳了,已经帮你写好请假条,买好药了。”
以上就是AI Agent的工作原理。
总的来说,这个系统描述的是一个简化的模型,展示了是一个 AI Agent 如何从感知信息开始,经过一系列内部处理和决策,最终做出响应的过程。