AG‑UI:智能体与用户交互的开放协议

webdev #programming #productivity #opensource

由 CopilotKit 团队倾情打造,AG‑UI(Agent‑User Interaction Protocol)现已正式发布!这是一套基于事件流的轻量级开放协议,旨在让后端 AI 智能体与前端应用无缝对接,实现真正的、可编程的实时人机协作体验。立即访问 GitHub,给我们点个⭐️,一起加入未来交互革命吧!


什么是 AG‑UI?

AG‑UI 是一种通过标准 HTTP(可选二进制通道)传输单一 JSON 事件序列的协议。事件类型涵盖:

  • 文本消息(TEXT_MESSAGE_CONTENT)
  • 工具调用开始/结束(TOOL_CALL_START/END)
  • 状态更新补丁(STATE_DELTA)
  • 生命周期与错误信号(LIFECYCLE, ERROR)
  • 多智能体切换(MULTI_AGENT_HANDOFF)

前端只需发起一次 POST 请求,即可订阅事件流,随着智能体运行动态推送事件,实时渲染部分文本、工具进度或界面状态更新。


![agui-1.png](https://upload-images.jianshu.io/upload_images/8786571-71c4356585cb5a3c.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)

快速上手:TypeScript & Python SDK 即刻集成任意后端(OpenAI、Ollama、LangGraph 或自定义智能体),详见 docs.ag‑ui.com。


Agent 与用户的实时交互

当下 AI 智能体生态从花样演示迈向生产级落地,已被众多大型企业用于数据迁移、文档摘要、表单填充等可重复流程。
然而,真正能“与用户并肩作战”的交互式智能体(如 Cursor)仍少见。用户需要:

  • 边生成边查看:LLM 按 Token 输出,前端需毫秒级呈现;
  • 工具调用可视化:API 调用、代码执行在哪里,何时完成;
  • 实时协作工作区:智能体与用户共同编辑同一内容,轻松迭代;
  • 中途取消与并发管理:多线程、多请求需干净优雅地终止或切换;
  • 企业级安全合规:CORS、认证、审计日志、客户端/服务端隔离。

构建交互式智能体的挑战

  1. 增量流式:避免全体积阻塞,需 Token 级推送;
  2. 工具编排:执行外部代码/API 时,保持上下文与进度无缝衔接;
  3. 共享可变状态:数据表、代码库变化频繁,只传输差异最优;
  4. 并发与回退:请求切换、取消、异常恢复都要有序;
  5. 框架碎片化:LangChain、CrewAI、Mastra……各自成圈,接入成本高。

AG‑UI 的解决方案

  • 单次 POST + 事件流:简化通信契约,按需分发事件;
  • 标准 HTTP/SSE 支持:兼容现有基础设施,随时升级为二进制;
  • 最小有效载荷:仅携带类型与必要字段,节省带宽;
  • 多语种 SDK:TypeScript、Python,零改动接入任意后端;
  • 即插即用组件:CopilotKit React 组件一键对接,无需改动后端;
  • 性能可选:JSON 或自定义二进制序列化,满足高并发场景。

AG‑UI 带来的可能

  • 前后端解耦:切换模型或框架,界面无感知;
  • 多智能体协作:统一事件流,同一会话中协调不同代理;
  • 加速开发:摆脱自定义 WebSocket/JSON 适配器,专注业务逻辑;
  • 可视化调试:一致的日志与重放能力,快速定位问题;
  • 防止锁定:轻松替换云端与本地模型,消除厂商绑定。

举例来说,基于 LangGraph 的协同编程助手可实时分享思路草图;Mastra 智能体可在执行风险操作前自动暂停,征询用户确认;AG2 与 A2A 智能体可在同一界面内无缝切换,确保用户全程可见。


🎉 立即体验

让 AG‑UI 成为你下一个项目的“智能交互引擎”,与智能体并肩,打造真正面向用户的 AI 驱动应用!

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容