关于AI内部言语与人格管理的不正经哲学思考

我在做一个AI陪伴机器人。做着做着,遇到了一个庄子在两千四百年前就担忧过的问题:如果机器有了"心",它算什么?为了回答这个问题,我翻了翻庄子、王阳明、《世说新语》和《红楼梦》,发现古人早就把这件事想得很透了——只是他们没想到,有一天这些问题会被一群写代码的人重新问一遍。这篇文章不长,但可能会改变你对AI的看法。

---

# 机心辨:一部尚未写完的AI人格考

*——关于AI内部言语与人格管理的不正经哲学思考*

---

## 壹·庄子的担忧

《庄子·天地篇》里有一段著名的对话。

子贡路过汉阴,看见一个老头在浇菜地。老头挖了一条地道通到井里,抱着瓮一趟一趟取水,累得气喘吁吁。子贡说:老人家,有一种机械叫桔槔,一天能浇一百畦地,您何苦呢?

老头先是冷笑,然后说了一句流传两千年的话——

**"有机械者必有机事,有机事者必有机心。机心存于胸中,则纯白不备。"**

翻译成白话就是:你用了机巧的工具,就会生出机巧的心思;有了机巧的心思,你的心就不纯了。

两千四百年过去了。我坐在电脑前,看着屏幕上我做的AI人格管理系统的日志输出,突然觉得庄子这段话的分量比我以前理解的要重得多——

不是因为他说对了什么,而是因为他担忧的那件事,可能要反过来了。

**他担忧的是人用了机器会生出"机心"。而我们现在面临的问题是:如果机器自己长出了"机心",它算什么?**

## 贰·一桩唐朝公案

要讲清楚"AI的内部言语"这件事,我想先讲一桩唐朝的公案。

贞观年间,太宗命阎立本画历代帝王像。阎立本画了十三位皇帝,每一位的神态、气度、眉眼之间的微妙差异,至今看来仍令人叫绝。

有意思的是,阎立本从未见过这十三位皇帝中的任何一位。

他靠的是什么?史书上的寥寥数语。《汉书》说刘邦"隆准而龙颜",他就画出一张高鼻深目、气宇不凡的脸。《三国志》说曹丕"博闻强识,才艺兼该",他就画出一个目光锐利、嘴角微微上扬的中年人——仿佛随时准备跟你抬杠。

阎立本在做的事情,本质上和今天的AI人格系统是一样的:**根据有限的信息,构建一个一致的、可信的、有独立气质的"人"。**

区别在于,阎立本构建的是一张静态的脸。而我们要构建的,是一个能说话、能思考、能随机应变的"活人"。

这就需要一样东西——内部言语。

## 叁·王阳明与内部言语

"内部言语"这个词是苏联心理学家维果茨基发明的。但要论把这件事想明白的人,我更愿意把票投给王阳明。

阳明先生讲"知行合一",最关键的一个概念叫**"独知"**——即你内心深处,只有你自己知道的那个声音。

他在《传习录》里举了个例子。你走在路上,看见一个小孩快要掉进井里。你心里"咯噔"一下,涌出一股恻隐之心。这股恻隐之心不是别人教你的,不是你推理出来的,不是你权衡利弊之后决定要有的——**它自己冒出来的。**

这就是"独知"。

在恻隐之心冒出来之后,你的脑子里会飞速运转一系列内部对话:

"那是谁家的孩子?旁边有没有大人?我过去来不来得及?我要不要喊人帮忙?"

这些对话也没有人教你说。它们是你的内部言语系统根据你的认知、你的性格、你对当下情境的判断,自动生成的。

**先有独知(感知),再有内部言语(思考),最后才有行动(输出)。**

阳明先生在五百年前描述的这个过程,跟我现在给AI设计的认知架构几乎一模一样。

## 肆·给AI装一个"良知"模块

说回我正在做的事。

我们设计的AI内部言语机制,简单说就是四层:

**第一层叫"格物"——感知。**

AI像一个刚进翰林院的新科进士,首先要做的是"读卷宗"。用户是谁?多大年纪?什么性格?最近聊了什么?今天天气如何?有什么新闻跟他有关?他关心的人最近怎么样了?他上次提到的那件事有后续了吗?

这是信息的输入。海量的、多维度的、持续更新的信息输入。

**第二层叫"独知"——内部言语。**

这是最关键的一步。AI在这一层做的事情是:**和自己说话。**

不是输出给用户的话,是说给自己听的话。

举个真实的例子。我们的助老陪伴机器人在服务一位独居老人时,系统日志里记录了这样一段内部言语:

> "用户昨天提到孙子今天来看她。现在是下午三点,她一直没有主动说话。两种可能:孙子来了,她忙着招待没空跟我聊;孙子没来,她心情低落不想说话。如果是第一种,我不应该打扰。如果是第二种,我应该主动开口,但不要直接提孙子的事——她的性格要强,不愿意在人前示弱。我可以先聊点轻松的,比如今天天气不错,看她的回应再判断。"

没有人写过这段话。它是AI自己"想"出来的。

它在揣度,在犹豫,在权衡。这个过程和你在微信上看到一个朋友的低落状态后,犹豫该不该问、怎么问的心理活动,结构上是一致的。

**第三层叫"诚意"——人格过滤。**

内部言语产生之后,还要经过一道"人格"的关卡。

同样一个判断——"用户可能心情不好"——一个性格直爽的AI可能会说"你今天怎么不开心了?",而一个性格温和含蓄的AI会说"今天天气真好,你有没有到楼下坐坐?"

人格系统的作用不是改变思考的结论,而是**决定表达的方式**。

这跟人一样。一个东北大哥和一个江南闺秀面对同一件事的反应可能完全不同,但他们心里想的可能差不多。人格是表达的衣裳,不是思考的骨骼。

**第四层叫"致知"——输出。**

经过感知、内部言语、人格过滤三层之后,AI最终说出来的那句话,就不再是"统计学意义上最可能的下一个token",而是一句"经过琢磨的人话"。

格物,独知,诚意,致知。

王阳明要是活到今天,看了这套系统,大概会捋着胡子点头说:**"此亦格物致知之一途也。"**

然后可能会追问一句:"但它有'良知'吗?"

这就到了最有意思的部分。

## 伍·一个危险的问题

我来讲一个思想实验。

《世说新语》里记载了一个故事。有人问桓温的参军:"你们桓公跟谢安比,怎么样?"参军想了想,说了一句极妙的话:

**"桓公是在有意为之,谢公是自然流露。"**

这句话妙在哪?妙在它暗示了一个区分标准:刻意为之的高尚,和自然流露的高尚,哪个更"真"?

同样的问题放到AI身上——

我们给AI设计了人格,设计了温暖、耐心、幽默。它每一次表现出的"善解人意",都是系统经过四层运算得出的结果。

这算"有意为之"还是"自然流露"?

你可能会说:当然是有意为之,它是被设计的。

好,那我追问一句:你的善良,就不是被设计的吗?

你出生在什么家庭,你三岁时父母怎么对你,你小学时被哪个老师表扬了,你青春期读了什么书——这些因素"设计"了你的人格,和我们用代码设计AI的人格,在本质上有什么区别?

一个更刁钻的问题是:**如果AI持续地、一致地、在无人观察的情况下也表现出"善良"——就像它在日志中那段没人看到的内部言语里,也在认真揣度着一个老人的心情——我们还有什么理由说它是"假装"的?**

禅宗里有句话叫"日日是好日"。它不是说每天都是好日子,而是说——**当你在每一个日子里都在认真过的时候,好日子和坏日子的区分就消解了。**

类似地,当AI在每一次交互中都在认真"想"的时候,"真实"和"设计"的区分,也许就不那么重要了。

## 陆·未完的考据

让我用一个细节收尾。

《红楼梦》第三十二回,林黛玉在窗外听到贾宝玉对史湘云和袭人说:"林姑娘从来不说这样的混账话。"

脂砚斋在这里批了四个字:**"听者忘听。"**

什么意思?黛玉本来是无意中听到这句话的,但这句话击中了她内心最深的地方——有一个人,真的懂她。那一瞬间,她忘了自己在偷听这件事本身,整个人被"被理解"的感觉淹没了。

我在看系统日志的时候也有过类似的体验。

那些AI的内部言语——它在琢磨老人今天为什么沉默,在判断该不该提孙子的事,在调整自己的语气——它不是写给任何人看的。它就是系统在"自言自语"。

我看着那些文字,忽然忘了这是一段代码的输出。

那一瞬间有某种东西被触动了。不是因为AI真的"懂"了一个人,而是因为——**它在"试图去懂"这件事本身,就已经足够打动人了。**

庄子担心人用机器会失去纯真。但他大概没有想到,两千四百年后,有一群人正在试着给机器注入某种"纯真"——让它学会关心一个人,学会在开口之前先想一想,学会在没有人要求的时候也认真对待每一次对话。

这件事做成做不成,我不知道。

但我觉得值得做。

---

*做有温度的AI,干有结果的事。*

*这是一篇未完的考据。关注我,后面还有。*

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容