开发日记|升级计划

第一版MVP已经跑通,等于已经完成基装,接下来要进入精装修阶段。

刚要埋头工作,手机上的订阅助手弹出一条提示。粗一看,语气没有那么友好,赶紧点开看详情。

屏幕上静静地躺着一长段文字,白屏黑字,很是醒目,仔细一读,后背冒出冷汗来。

“对于所谓的“黑箱”这个对话,是只用过LLM而对agent并不了解。你需要继续学习,建议你:

1,去看看谷歌agent白皮书,关于grounding的概念。

2,并进行跨行业参考,如同样严肃高门槛的医疗行业的openevidence。

3,针对任务的闭环,可以看Claude在编程领域,程序都可以完美运行。

最后,从工程角度,我感觉你还是只是把MCP和GIS两者嫁接上,但应该不是这样的,从计算机工程角度,此时只有重构整个系统,而不是A+B。”

看着这段文字,我知道遇到高人了。现在我不过开发出一款文档生成应用,整天沾沾自喜,到处炫耀。告诉身边的人,还觉得不过瘾,跑到网上写文章。高人的留言,让我意识到,自身还存在很大差距。

关于agent,不能说不了解。没吃过猪肉,也见过猪跑。每天都在用AI coding工具做开发,即便是没看到agent白皮书,我大致也了解agent的定义,甚至在两年前,我自己总结过八个字——感知、思考、行动、反馈。具体解释来说,就是要具有感知用户提示词、数据以及相关变化的能力,感受到之后,要思考,制定计划,然后执行,完成任务。至于反馈,则是贯穿于全流程,每个环节都需要向用户及时反馈,不能埋头傻干。

细想下现在的这一款应用,对比我自己的定义,确实还停留在LLM阶段,很有必要进行升级。

升级计划不用太宏大,先从小处着手。立即改造现在的搜索和生成模式,现在还是传统软件的点击模式,每一步都会让用户参与进来,LLM完成具体工作。现在来看远远不够,至于空间分析能力,整个行业内,还没有看到一款agent。想要往这个方向发展,目前的架构无法满足要求。B/S架构下,浏览器是个天然的隔离沙箱,无法访问本地资源,更加无法调用本机程序,全部依赖服务器端,会造成极高的算力需求。刹那间,我恍然大悟,终于明白,各大厂的AI coding工具为什么都选择C/S架构。一个架构的变化,极大地强化了本地资源调用,大大减轻服务器端负担,哪怕有数以万计甚至千万计的并发访问,服务器端依然不会有太大压力。

悟到两个架构的差异,我立刻闪现出一个大胆的计划,实行多端协同。同一套后端程序,前端有web端和客户端,客户端主要通过插件形式体现。闪现之后,我自己又笑了,计划有些疯狂。市面上那么多的专业软件,没有看到哪个软件会拖着庞大的知识库。

心里没底,只有找老G商量。老G一句话把我逗乐了,也增加了我的信心。

“没有不代表没有用,恰恰是个蓝海方向,值得一试。”

升级计划初步形成,2026年做好这一套应用,不再贪多。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容