2025年春季的AI编程工具市场迎来关键转折点。在Cursor、GitHub Copilot 凭借Agent模式,重新定义了全流程自主生成、运行、修正,从而多轮反思达到工程项目解决需求和问题的目的。4月份,CodeBuddy推出的Craft智能体,用于「多文件自主AI协同编码生成」的产品交互突破。下图展示了一个包含六个步骤的软件开发工作流程图,流程依次为:在Edit Chat提出需求并添加文件、需求理解与规划、文件操作(读取/新增/修改)、IDE实时编码渲染、组织变更清单、接受或回退变更。
一、功能对比:工程化深度决定工具上限
(1) 生成维度差异
Cursor Agent的强项在于本地IDE上控制内核IDE的编码心流,并串接了各个时机,如提供精准代码生成、内联对话、以及唤起内置的编码智能体来调用AI能力完成编码。
Craft是通过主流的IDE上实现通过「需求-拆解-执行-验证」四阶段工作流,可完成如「为电商系统增加风控模块」这类涉及20+文件的系统工程任务。用户输入自然语言需求后,Craft会自主规划技术方案、检索代码库、生成模块间接口,并以diff视图展示变更。这种「项目级AI架构师」能力,使其在React组件重构、微服务链路改造等场景优势显著。
(2) 生态整合能力
Craft率先支MCP市场,可直接调用主流的MCP服务,例如开发AI Agent时,开发者无需自行搭建服务器,通过MCP协议即可完成主流的MCP服务的工具的本地安装和运行。在这种交互下,构建如小程序、企业工程项目的时候可以具备端到端解决方案能力基建。
(3) 人机协作模式的Plan模式的创新
Craft的对话面板支持历史记录回溯与版本树管理,解决了AI生成代码的「面目全非」的难题。开发者可逐行采纳/拒绝代码变更,或在出现功能偏离时通过技术对话实时纠偏。同时Craft 推出Plan模式,可以很好的解决需求描述不清楚的进阶的计划智能体辅助做好需求澄清工作。相较于Cursor的Agent直接生成,会更容易达成修改目标。
二、 实战检验:五子棋案例中的工具效能
需求拆解到任务完成
提问内容: 创建一个微信小程序,实现五子棋游戏。游戏应包含完整的五子棋规则,包括黑白双方轮流下子、连线判断胜负、禁手规则等。同时,需要明确展示玩家何时会失败,例如无合法位置可下、超时未下子等情况。请确保代码结构清晰,界面友好,用户体验流畅。
考察目标:生成的五子棋小程序,可在微信IDE中打开,并编译运行成功。
1. Cursor的表现
调用了三个工具:
1. 读目录,判断是否空项目
2. 写目录,为小程序创建工程
3. 生成文件
最后生成了8个文件。
打开微信小程序,看下运行后的效果。
第一次并没有能够落子,点击没有反应,同时也报错了。接下来我把错误贴到Cursor进一步让他做完,看看是不是可以纠正正确并运行。
能落子,但无法很精准的落子到棋盘,并且游戏输赢逻辑也不对,但至少报错没有了。我进一步去优化问题。
优化问题: 无法落子,请优化下棋盘落子事件,并需要对准棋盘完成黑白子的五子棋游戏。
最终还是没有办法正常模拟五子棋游戏。。
2. 腾讯云Craft表现
首先开启了Plan模式,并用相同的提问内容。Plan模式下会询问很多澄清,就像是一个产品经理与开发者的需求澄清,拆解需求任务,对于不清楚的问题,他会提问给你,你只需要回答即可。
当需求澄清清楚后Code Buddy还提供了mermaid代码,我用mermaid online查看了一下描述的还不错。
然后附上了每个操作的实现方案。你只需要点击「开始」按钮进入代码生成阶段。
生成了总共10个文件
让我看看运行效果。打开微信IDE,导入工程。直接运行成功,并且落子正确。
三、 实战检验:用户操作的流畅度和体验
Craft
比较简单,仅提供对话框和添加文件,结果展示也比较简单。
Cursor
上述在Cursor均有所考虑
在引用上下文层面非常全面
支持将终端问题反馈直接添加到chat edit对话框中
可以实现重新生成、展示代码、收缩代码展示
四、总结一下
总体上 各插件在各方面存在一些差异性,Cusor 属于原生IDE, 交互生成体验上可以超越插件本身,效果可以做到最优。作为喜欢本地IDE的用户会更倾向于选择和使用,但20美金的定价和数据代码外流也会劝退一些开发者。而CodeBuddy从应用生成的质量和效果上,算是目前不错的平替。由于在插件层面无法超越,所以生成的体验上中规中矩,细节处理上还有蛮多空间可以优化。团队基本上一天一个版本的节奏也是非常的卖力。Craft的Plan模式是一个很好的差异,在模型能力本身还无法完全比对最强claude模型的时候,通过Plan写清楚扩展完整需求,为接下来的任务拆解提供了更精准的信息和方向,无疑是一个很好的想法。