Agent 学习手记(一):了解Agent

AI Agent(简称Agent)是大语言模型(LLM,简称大模型)落地的重要方向。Agent是利用大模型构建的面向业务场景的AI应用,在大模型能力的基础上,通过记忆、规划、使用工具插件、调用知识库等能力,执行更复杂的任务。与使用提示词和大模型对话相比,Agent更智能、更有效。通过Coze(扣子)等Agent开发平台,非AI技术出身的也能够零门槛设计开发自己的Agent,打造自己的专属AI助手。

一、什么是AI Agent

1. 概念

Agent的中文意思是“代理人”。基于大模型的Agent,相当于具有特定事务处理能力的,存在于计算机程序等虚拟环境中的大模型代理人。Agent不仅是聊天机器人的升级版,告诉你“如何做”,还可以精准执行任务,“帮你做”。所以也有人把智能体称作“数字员工”“AI机器人”(如深圳首批70名“AI公务员 ”正式上岗)。

用一个公式:Agent=大模型+记忆+主动规划+工具使用

2. 能力

基于大模型的Agent具备自主记忆、推理、使用工具和行动能力。通过设计,Agent被赋予自主规划、自主行动的能力,能够根据环境进行判断、做出选择,并采取行动,而不是被动地接受外部指令做出预先设定的简单反应。

举个例子:

我晚上设了一个闹钟,让它明天上午7:00准时响。这算一个 Agent 吗?当然不算。

一个Agent会怎样呢?假如设计一个"叫醒 Agent "。在晚上睡觉前,可以给 Agent 发出了这样的指令:"明早叫醒我,想办法别让我迟到。"

接下来, Agent 用互联网数据进行检索,知道你的公司在什么位置,公司要求几点打卡。 Agent 又根据手机地图软件的导航使用信息知道你平时习惯开车通勤,再根据明天早晨的天气和路况预测,判断你大约需要驾车35分钟抵达公司。当然,如果你偷懒,不事先设计这样的流程,就可以让Agent直接问你,到公司需要多长时间。

继续让 Agent 提出问题:"你早上在家有哪些准备事项?需要多久?" 你回答:"早上洗漱和用餐大概需要30分钟"。于是, Agent 做出了决策。在第二天的7:45, Agent 准时响铃,但在7:50监测到你依然躺在床上没有起来。这时, Agent 控制客厅的智能音箱播放激昂的说唱音乐,你只能走到客厅才能关闭它……你彻底醒了,按时抵达公司,打卡出勤。

从上面的例子可以看出, Agent 将多种功能集成封装在一起,被赋予自主规划和行动的能力,能够根据环境进行判断、做出选择,并采取行动,而不是被动地接受外部指令做出预先设定的简单反应。同时, Agent 允许用户已自然语言的形式输入自己的需求,而不需要提供一系列完整的操作指令,大大降低了用户使用门槛 。

3. 应用场景

无论是个人用户还是企业用户,都可以根据自己的需求灵活地应用 Agent 。它们可以被集成到各种应用程序和服务中,提升工作流程的自动化水平和个性化服务能力。

例如,一个基于大模型的 Agent 集成到客户服务系统中,通过自然语言处理和机器学习技术,自动回答客户的咨询问题,提供个性化服务,或者被用于数据分析和预测,帮助企业做出更明智的商业决策。这些应用不仅提高工作效率,还可以为用户提供更丰富和更便捷的体验。

 Agent 可以对现有软件进行智能化改造升级,改变业务流程和个人交互方式。

例如,手机 Agent 可以在手机中跨应用(App)自动执行一个复杂任务,打破应用之间的界限,成为替你操作App的助手。你可以直接向 Agent 发出指令:“找一家开车10分钟内可以到达而且好停车的火锅店,请来自湖北的两位客户吃饭。” Agent 将会自动操作大众点评或者美团,根据你的要求筛选出满足条件的火锅店,再自动打开百度或者高德地图,找到附近的停车场,开启导航,甚至还可以自动联系餐厅预订座位,自动通过智能汽车App提前启动汽车。

4. 应用价值

 Agent 影响个人和生活方式

每个高效能人士的背后,都可以有多个专业的 Agent 助手:分析和总结庞杂的资料;快速生成专业报告;内容创作;贴心的生活助理;提供情感陪伴……

 Agent助力企业降本增效

领先企业正在使用大量 Agent 数字员工,企业中每个员工、每个岗位也都可以配备专属数字助理:企业营销智能化;专业服务交付批量化;人力资源管理精细化……

除了在营销、专业服务与人力资源管理, Agent 再医疗、教育、公共交通、制造、农业等领域都有着广阔的发挥空间。

例如医疗领域, Agent 可以通过分析整体人群的健康数据,预测糖尿病、心脏病等疾病的发展趋势,为公共卫生管理提供决策支持;还可以通过图像识别技术进行疾病诊断,弱化医生的个人经验因素,提高诊断的准确性和效率,提升偏远地区的医疗水平。 

二、 Agent 开发知识储备

借助自然语言处理技术和 Agent 开发平台,开发 Agent 对开发者的技术要求大幅降低,任何想要开发 Agent 的人,即使不懂编程,都可以不用编写任何代码开发 Agent ,而不限于软件公司、技术人员。

1. Agent 工作原理

 Agent 的基本决策流程:感知→规划→行动

 Agent 的4大能力:规划、记忆、使用工具、行动

2. 业务流程知识

在现实生活和工作中存在大量的业务流程。如,使用网约车,登录App → 定位出发地 → 选择到达地 → 选择车型 → 等待车辆到达 → 确认信息 → 行驶到达 → 支付 → 评价 ;进行市场调研,确定调研主题 → 搜集资料 → 梳理分析资料 → 提炼观点 → 列出提纲 → 细化内容 → 输出调研报告 → 修改完善 ……

业务流程是给特定用户创造价值,满足其需求的相互关联的一组活动进程。一个完整的业务流程通常包括6个要素:输入的资源、流程活动、活动间的相互关系(串行还是并行、先后次序等)、输出的结果、下游用户(输出结果给谁)、流程价值(解决了什么问题)。

Agent 能够促进业务流程的自动化和智能化。Agent 的开发过程就是针对具体业务场景,通过工作流(workflow),通过AI技术,实现业务流程自动化、智能化的过程。

3. 业务流程优化

业务流程优化目标

质量提高,成本较低,效率提高,风险管控。

业务流程优化步骤

需求收集与立项 → 业务流程再现与痛点分析 → 业务流程改善与目标设定 → 业务流程优化设计 → 业务流程落地实施准备 → 复盘与运行监测。

业务流程优化工具

用业务流程图显化业务流程。常用的业务流程显化工具有泳道图、乌龟图、简易流程图等。简易流程图使用活动框、判断框、连接线等图例,就可以直观地呈现业务流程的运行过程。

业务流程优化方法

通用的业务流程优化方法有:

①清除、取消:识别不增值的工作过程,然后将其清除、取消。

②简化:尽可能让复杂活动简单化,提高流程效率。

③合并整合:尽可能整合多项活动,减少工作过程的非工作时间。

④减少动作切换:尽可能让同一个岗位完成一项完整的工作,减少动作切换的时间。

⑤串并联设计:尽可能设计并联活动,同步协作开展工作,提高效率。

⑥重排工作顺序:通过观察业务流程的各个环节,调整不合时宜的作业活动的顺序,提高流程的连贯度。

⑦迁移决策点:决策点尽可能靠近需要进行决策的环节。

⑧打通横向信息流:通过对备案、抄送等环节的设置,加强信息横向流动与共享。

⑨设置质量检查机制:在工作的过程中设置质量检查机制,确保达到业务流程质量的目标。

⑩自动化:尽可能通过线上流转信息、工作,在留痕的同时提高业务流程的效率。

这10个业务流程优化方法的使用范围十分广泛,既可以用于线上流程,也可以用于线下流程,但是并不是所有方法都适用于开发 Agent 所涉及的业务流程优化,你需要根据业务流程的特点选择可用的优化方法。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容