AI的未来在哪里?

LLM火了,但通用大模型最终只可能像操作系统一样,只有少数几个玩家能活下来。于是垂直大模型又火了,但垂直大模型可能压根是个伪命题。

为什么你觉得需要垂直大模型呢?因为通用大模型在某个具体的领域,知识没有深度对吧?那么其实有三个思路可以解决,成本从低到高依次是:

1、RAG,外挂一个本地知识库。RAG其实是没有推理能力的,只有检索能力。然后通过LLM把检索出来的本地知识库片断以说人话的方式说给用户。成本低。

2、训练一个小模型,然后用tools的方式,被LLM调用。小模型不用那么多参数,甚至不用预训练,直接用打标数据训练一个专项的模型。比如IBM的沃森,就算今天有了大模型,它仍然只需要做个小模型就好,参数顶天了上万个够不够?小模型有垂直领域知识,有推理能力,成本也不算高,而且可维护性可扩展性上都和LLM解耦了。是最佳实践了吧。

3、基于LLM基座,加入垂直领域的预训练、微调和增强训练,得到一个垂直大模型。成本很大啊,训练成本很大,哪怕是Lora,而且有可能让LLM基座造成灾难性遗忘,更让人头大的是,如果LLM基座升级了怎么办?要基于新基座再重新训练垂直大模型吗?调岀来的结果是好是坏未知,毕竟基座那么多参数是黑盒,调参就是摸彩票啊。另一个值得高度重视的问题是,fine tuning和传统的打标数据小模型完全不是一回事,fine tuning的作用更多的是sample打样,引导LLM从pre-train积攒的信息,以更可控的方式输出。fine tuning是重质不重量的,不需要太多样本。LLM本质上还是文字接龙,对于严肃的场景,它是完全不如传统的打标数据小模型可靠的,比如医疗、无人驾驶,你敢拿命来玩吗?

反思一下出发点:我们为什么需要LLM基座呢?只是因为LLM的交互方式更加接近自然语言交流对吧?我们要的是它的NLP、多模交互、情感识别等等基础能力对吧?那么1、2完全可以达到目的啊,成本低还没有任何负作用。所以,垂直大模型会不会压根就是伪命题?

AI的未来在哪里?或者说,如何避开和chatgpt为首的基座大模型正面竞争?

RAG不是。RAG是最容易上手的方向,本地知识库没什么门槛,应用场景也很浅。RAG的地位类似于web1.0的cms一样,是个LLM工程师就得会的基本功。

AI agent是。function call是个好东西,多模交互是个好东西,ReAct更是个好东西。有了它们就有了贾维思的条件,连上硬件更可以得到幻视!问题的关键是,如果chatgpt这种基座大模型公司自己下场做agent呢?注意,chatgpt有最聪明的LLM,通过gpts它还有最全的tools,gpt4-o证明它还有最强的多模交互。做通用型的agent就像做通用大模型一样,一定干不过chatgpt这种公司。只能往这几个方向深入下去,才能立住脚:

1、软硬结合,通过丰富多样的硬件传感器拉开和通用agent能力的差距,无论是对真实世界的感知力,还是action能力,都是硬件的强项。LLM再怎么发展,触手也仅限在缸中之脑上,chatgpt的优势无法延伸过来。关键点在硬件传感器上。

马斯克的人形机器人就符合这个方向。从贾维思到幻视,次元壁就这么突破了。

2、垂直领域私人助理。在长期memery、RAG和定制action的联合作用下,让agent既具备垂直领域能力,同时还知道用户的长期个人档案,不仅是行业专家,还特别了解你懂你。而且2和1不冲突,叠加起来威力更惊人。

下一代的windows和iphone都在朝这个方向推进,让我们设想一下:在本地记录用户的行为并保存下来,最强memory!让用户和操作系统之间的交互不再是stateless;而且ReAct思想之下,所有的software都可以api接口化,可以是本地api,也可以是网络api,直接在操作系统级别运行tools。微软、苹果、google这种公司可以直接在操作系统层面截胡agent,比gpts还可怕,所以chatgpt自己成为系统级入口肯定是势在必行的,gpt4-o的多模交互和实时性响应也证明它们确实有成为系统级入口的资本。

我们普通公司肯定是挤不进系统级入口这个赛道的。但包括chatgpt在内的操作系统、准操作系统们都没法在垂直方向上深挖。我们只需在应用层做垂直agent即可。通过树莓派之类的做个独立于操作系统的小而美硬件也是个方向。

3、多agent合作,集团作战。多个垂直agent如果合作起来,会发生什么化学反应?道生一,一生二,二生三,三生万物,众妙之门。

这是最让人兴奋的方向,因为想象力才是唯一天花板。想想看,你的erp、oa直接变成了虚拟员工,采购啊、hr啊都可以裁了。photoshop、eclipse、axure、jira变成设计师、程序员、产品经理和项目经理,it外包都省了。以前编程是面向对象编程,以后是面向agent编程。

福特说的“我需要的是一双手,结果得到了一个人”问题就可以解决了。比流水线还流水线。

多agent可以是虚拟的一套系统,只服务于电子世界,也可以连上硬件服务于现实世界。多agent的关键是对业务的深度理解,既是挑战也是壁垒。

上面提到的123并不冲突,可以组合。LLM的发展很快,垂直大模型方向不对,属于不动脑子地蹭热点。而RAG只是个hello world,真正的精彩是见证下一代操作系统(LLM作为用户入口,和应用层基座),以及下一代应用(上文提到的123)。我很期待,也很想恭身入局,问题是,总被挑战廉颇老矣尚能饭否。能。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 211,817评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,329评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,354评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,498评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,600评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,829评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,979评论 3 408
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,722评论 0 266
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,189评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,519评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,654评论 1 340
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,329评论 4 330
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,940评论 3 313
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,762评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,993评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,382评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,543评论 2 349

推荐阅读更多精彩内容