AI技术图谱:Agent、RAG、Skill、MCP、Harness到底什么关系?

这篇文章就是我这一周的学习笔记,写给和我一样的产品经理——不是要成为技术专家,但至少要知道这些东西是什么、什么时候需要、怎么组合在一起。

先说清楚:这不是银弹

在聊技术之前,先泼个冷水。

不是所有AI需求都需要Agent。不是所有知识问答都需要RAG。不是所有场景都要上MCP。

我见过太多"为了用技术而用技术"的案例。老板说要AI客服,产品经理就去找Agent方案;老板说要智能问答,产品经理就去搞RAG。结果呢?开发成本高、效果不稳定、用户体验差。

技术是为业务服务的。 先想清楚要解决什么问题,再想用什么技术。

好,下面进入正题。

一、Agent:能自己干活的AI

什么是Agent?

如果你问我,我会说:Agent就是能自己干活的AI。

传统的AI模型是被动的——你问它答,像个知识渊博但行动力为零的顾问。Agent不一样,它能:

  1. 理解目标:知道你要干嘛
  2. 拆解任务:把大目标拆成小步骤
  3. 调用工具:查数据、发邮件、写代码
  4. 执行行动:不光说,还真的去做
  5. 反思调整:做错了会改

举个例子。你让ChatGPT"帮我订一张明天去北京的机票",它会告诉你怎么订、在哪订。但你让Agent做同样的事,它可能真的就去查航班、比价、下单了(当然,前提是给它足够的权限和工具)。

Agent的核心能力

Agent的核心能力

Agent的运行逻辑是一个循环:感知 → 决策 → 行动 → 反馈

感知:接收用户的输入,理解意图。不仅是文字,也可能是图片、语音、传感器数据。

决策:根据目标,判断下一步该做什么。这里涉及规划、推理、工具选择。

行动:执行具体操作。可能是调用API、查询数据库、发送通知。

反馈:根据执行结果,判断是否完成目标,是否需要调整。

这个循环会一直转,直到任务完成或者超出限制。

什么时候需要Agent?

我踩过坑。第一次做AI产品,老板说"要智能",我就上了Agent。结果开发了一半发现:用户的需求根本不需要Agent,一个简单的API调用就够了。

适合Agent的场景

  • 任务需要多步推理
  • 需要调用多个工具
  • 环境动态变化,需要实时决策
  • 用户意图模糊,需要主动澄清

不需要Agent的场景

  • 简单的问答(FAQ)
  • 单一API调用
  • 规则明确的流程
  • 用户意图清晰的一次性请求

产品经理的心法:能不用Agent就别用。Agent复杂度高、成本高、稳定性差。如果你的场景一个API就能搞定,为什么要上Agent?

二、RAG:给AI装个"外挂知识库"

什么是RAG?

RAG的全称是 Retrieval-Augmented Generation,检索增强生成。

说人话:给AI装个外挂知识库。

大模型的知识有截止日期,而且不可能知道你们公司的内部文档、产品资料、客户信息。怎么办?RAG的思路是:用户提问时,先去知识库里找相关内容,把找到的内容作为"上下文"喂给大模型,让它基于这些内容回答。

RAG的工作流程

RAG的工作流程

RAG的核心流程分两步:索引阶段检索阶段

索引阶段(离线)

  1. 把文档切成小块(Chunking)
  2. 把每个小块转成向量(Embedding)
  3. 把向量存到向量数据库

检索阶段(在线)

  1. 把用户问题转成向量
  2. 在向量库里找最相似的内容
  3. 把找到的内容和用户问题一起发给大模型
  4. 大模型基于这些内容生成回答

RAG的坑

我第一次做RAG的时候,效果惨不忍睹。用户问A,它答B;用户问具体问题,它给泛泛而谈。后来复盘,发现这几个坑:

切分粒度不对:切太大,噪音多;切太小,上下文不完整。没有标准答案,得根据业务场景调。

检索不准确:向量相似度不等于语义相关性。有时候词对上了,意思完全不对。

上下文太长:塞给模型的内容太多,它反而不会回答了。大模型有输入长度限制,而且内容越长,越容易"走神"。

没有答案怎么办:用户问的问题库里没有,模型会硬编一个。这个最坑,需要设计兜底逻辑。

什么时候需要RAG?

适合RAG的场景

  • 知识密集型问答(企业文档、产品手册)
  • 信息时效性强(新闻、政策)
  • 专属知识库(内部资料)
  • 需要引用来源(学术、法律)

不需要RAG的场景

  • 通用知识问答(模型本身就会)
  • 创意生成(写文案、编故事)
  • 简单的逻辑推理
  • 不需要事实支撑的任务

三、Skill:AI的工具箱

什么是Skill?

Agent要干活,得有工具。Skill就是AI的工具箱。

比如你想让AI帮你查天气,它得有"天气查询"这个Skill;你想让它发邮件,它得有"邮件发送"这个Skill。

Skill的本质是对能力的封装。一个Skill可能对应一个API调用、一段代码、一个工作流。

Skill与Agent的关系

Agent是"大脑",Skill是"手"。大脑决定要做什么,手去执行具体操作。

一个Agent可以有多个Skill。比如一个客服Agent,可能有:

  • 知识库查询Skill(RAG)
  • 订单查询Skill(调用订单系统)
  • 退款处理Skill(调用退款接口)
  • 转人工Skill(触发人工介入)

Agent根据用户意图,选择调用哪个Skill。

产品视角:如何设计Skill?

粒度要合适。太粗,不够灵活;太细,管理成本高。我一般按"一个完整动作"来设计Skill。

输入输出要明确。每个Skill要清楚接收什么、返回什么。这不仅是技术问题,也是产品问题——你要想清楚这个能力的边界。

要有失败处理。Skill调用失败怎么办?重试?降级?转人工?产品经理要设计这些兜底逻辑。

监控和迭代。哪些Skill用得多?哪些失败率高?这些数据要能看到,才能持续优化。

四、MCP:AI连接世界的"插座标准"

什么是MCP?

MCP的全称是 Model Context Protocol,模型上下文协议。

说人话:AI连接外部世界的插座标准。

你可能会问:这不就是API吗?有什么区别?

区别在于:API是给程序员用的,MCP是给AI用的。

传统的API集成,需要开发人员写代码、调试、上线。每个API都不一样,集成成本高。MCP的思路是:定义一套标准格式,让AI能"插上就用",不需要每次都重新开发。

MCP解决了什么问题?

我举个真实场景。

你想让AI帮你查Notion文档、读GitHub代码、获取Figma组件。按传统做法,你需要:

  1. 开发Notion集成
  2. 开发GitHub集成
  3. 开发Figma集成
  4. 把这些集成接到AI系统里

每个集成都要写代码、调接口、处理异常。成本高、周期长。

有了MCP,平台方只需要按照MCP标准暴露接口,AI系统就能自动识别和调用。像USB接口一样——设备厂商按USB标准做接口,电脑插上就能用,不需要每次都装驱动。

产品视角的MCP

对平台方:如果你的产品想被AI调用,可以考虑支持MCP。这是未来AI生态的"入场券"。

对AI应用方:优先使用MCP生态里的工具,能大幅降低集成成本。

现状:MCP还在早期,生态不完善。目前主要是Anthropic在推,支持的工具有限。但这个方向我看好——标准化总是好事。

五、Harness:让AI稳定干活的"脚手架"

什么是Harness?

Harness这个词在AI领域还没有标准定义,我用它来指代:让AI稳定运行的工具链和框架。

Agent、RAG、Skill、MCP,这些都是"能力"。但能力要落地,还需要"保障"。

Harness就是这套保障系统,包括:

  • 监控:AI在干嘛、调了什么、花了多少钱
  • 日志:每次交互的完整记录,方便排查问题
  • 调试:为什么输出这个结果?哪一步出了问题?
  • 评估:效果好不好?怎么量化?
  • 版本管理:Prompt改了、模型换了,效果怎么变化?
  • 回滚:出问题了怎么快速恢复?

为什么需要Harness?

AI产品和传统软件不一样。

传统软件,输入确定、输出确定、流程确定。AI产品,输入一样,输出可能不一样;模型版本变了,行为可能全变了。

我踩过的坑:改了一个Prompt,看似没问题,上线后发现某类用户全挂了。因为没有足够的测试覆盖,也不知道会触发什么边界情况。

Harness就是来解决这些问题的。它让AI产品从"能用"变成"好用"再到"敢用"。

产品经理要关注什么?

监控指标:响应时间、成功率、Token消耗、成本。这些要有实时大盘。

评估体系:怎么判断AI回答得好不好?自动评估还是人工抽检?评估标准是什么?

迭代机制:发现问题后怎么快速修复?Prompt调整、模型切换、Skill更新,流程是什么?

成本控制:AI很贵。一次调用可能几毛钱,一天几万次调用就是几千块。要能算清楚账。

六、整体架构:它们怎么配合?

讲了这么多概念,最后串起来。

整体架构

一个完整的AI产品,技术栈大概是这样的:

用户层:用户发起请求,接收响应。

Agent层:理解意图、规划任务、协调执行。这是"大脑"。

能力层

  • RAG:提供知识支撑
  • Skill:提供工具能力
  • MCP:提供外部连接

模型层:大模型本身,可以是自建的,也可以是调API的。

保障层:Harness,监控、日志、评估、迭代。

产品经理的技术选型清单

最后,给产品经理一个实用清单。接到AI需求时,按这个顺序想:

第一步:真的需要AI吗?

  • 能用规则解决吗?
  • 能用传统软件解决吗?
  • AI能带来显著价值吗?

第二步:需要什么能力?

  • 需要多步推理吗?→ 考虑Agent
  • 需要知识支撑吗?→ 考虑RAG
  • 需要调用工具吗?→ 考虑Skill
  • 需要外部集成吗?→ 考虑MCP

第三步:如何保障稳定性?

  • 怎么监控?
  • 怎么评估?
  • 怎么迭代?
  • 怎么控制成本?

第四步:投入产出划算吗?

  • 开发成本多少?
  • 运行成本多少?
  • 能解决多少问题?
  • ROI是多少?

写在最后

这篇文章写完,我发现自己对AI技术的理解深了很多。

不是为了成为技术专家,而是为了做好产品决策。产品经理不需要会写代码,但要知道什么能做、什么难做、什么值得做。

技术日新月异,今天聊的Agent、RAG、MCP,可能明年就过时了。但背后的思维方式不会变:从问题出发,选择合适的工具,用工程化的方法落地。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容