1. 核心概览 (Core Overview)
如果说之前的 AI 只是“问答机”,那么 Agent 就是一个带有“循环控制逻辑”的推理引擎。它不再是单纯地输出答案,而是学会了“谋定而后动”。
2. 分段拆解 (Breakdown)
A. 什么是思维链 (CoT)?
思维链就是强制让 AI 在给出最终答案前,先写下它的中间推导过程。
对于架构师来说,这就像是开启了 Debug 日志。如果不开启 CoT,AI 就像一个只有 return 没有逻辑过程的方法,错了你都不知道为什么。
B. 生产环境的王牌:ReAct 框架
ReAct = Reasoning (推理) + Acting (行动)。这是目前最流行的 Agent 运行模式。它的工作流是一个闭环:
- Thought (思考): AI 描述当前要做什么。
- Action (行动): AI 决定调用哪个函数(Day 3 讲的内容)。
- Observation (观察): AI 拿到函数返回的结果。
- Loop: 回到第 1 步,根据观察到的结果,决定是继续下一步,还是结束并回答用户。
C. 全栈视角下的状态管理
当 AI 在进行“思考-行动”循环时,作为一个 Web 请求,它可能是耗时的。
异步化: 你需要使用 WebSocket 或 SSE (Server-Sent Events) 将 AI 的“思考过程”实时推送到前端,提升用户体验(不要让用户盯着转圈圈)。
状态持久化: 如果循环中途断了,你需要把之前的 Thought 和 Observation 存入 Redis 或数据库,以便恢复“案发现场”。
3. 最终总结 (Summary)
Agent 的本质是“自我修正”的能力。 通过 ReAct 框架,AI 从一个“单次调用”的函数变成了一个“有目标的执行过程”。作为架构师,你的任务是为这个过程提供充足的工具(Tools)和清晰的边界(Constraints)。
测验 (架构实战)
循环终止: 如果 AI 在 ReAct 循环中,发现工具返回的结果始终无法满足用户需求(比如查不到用户想要的便宜机票),它应该如何优雅地终止循环?
日志审计: 假设 Agent 执行了一次错误的删帖操作,你作为架构师,如何通过“思维链”来复盘是哪一步出了问题?(是 AI 想错了,还是工具给的数据错了?)
Prompt 策略: 如果你发现 AI 总是“跳过思考直接行动”,你应该在 Prompt 里加一句什么指令来强制它开启思维链?