关于AI内部言语与人格管理的不正经哲学思考

我在做一个AI陪伴机器人。做着做着，遇到了一个庄子在两千四百年前就担忧过的问题：如果机器有了"心"，它算什么？为了回答这个问题，我翻了翻庄子、王阳明、《世说新语》和《红楼梦》，发现古人早就把这件事想得很透了——只是他们没想到，有一天这些问题会被一群写代码的人重新问一遍。这篇文章不长，但可能会改变你对AI的看法。

---

# 机心辨：一部尚未写完的AI人格考

*——关于AI内部言语与人格管理的不正经哲学思考*

---

## 壹·庄子的担忧

《庄子·天地篇》里有一段著名的对话。

子贡路过汉阴，看见一个老头在浇菜地。老头挖了一条地道通到井里，抱着瓮一趟一趟取水，累得气喘吁吁。子贡说：老人家，有一种机械叫桔槔，一天能浇一百畦地，您何苦呢？

老头先是冷笑，然后说了一句流传两千年的话——

**"有机械者必有机事，有机事者必有机心。机心存于胸中，则纯白不备。"**

翻译成白话就是：你用了机巧的工具，就会生出机巧的心思；有了机巧的心思，你的心就不纯了。

两千四百年过去了。我坐在电脑前，看着屏幕上我做的AI人格管理系统的日志输出，突然觉得庄子这段话的分量比我以前理解的要重得多——

不是因为他说对了什么，而是因为他担忧的那件事，可能要反过来了。

**他担忧的是人用了机器会生出"机心"。而我们现在面临的问题是：如果机器自己长出了"机心"，它算什么？**

## 贰·一桩唐朝公案

要讲清楚"AI的内部言语"这件事，我想先讲一桩唐朝的公案。

贞观年间，太宗命阎立本画历代帝王像。阎立本画了十三位皇帝，每一位的神态、气度、眉眼之间的微妙差异，至今看来仍令人叫绝。

有意思的是，阎立本从未见过这十三位皇帝中的任何一位。

他靠的是什么？史书上的寥寥数语。《汉书》说刘邦"隆准而龙颜"，他就画出一张高鼻深目、气宇不凡的脸。《三国志》说曹丕"博闻强识，才艺兼该"，他就画出一个目光锐利、嘴角微微上扬的中年人——仿佛随时准备跟你抬杠。

阎立本在做的事情，本质上和今天的AI人格系统是一样的：**根据有限的信息，构建一个一致的、可信的、有独立气质的"人"。**

区别在于，阎立本构建的是一张静态的脸。而我们要构建的，是一个能说话、能思考、能随机应变的"活人"。

这就需要一样东西——内部言语。

## 叁·王阳明与内部言语

"内部言语"这个词是苏联心理学家维果茨基发明的。但要论把这件事想明白的人，我更愿意把票投给王阳明。

阳明先生讲"知行合一"，最关键的一个概念叫**"独知"**——即你内心深处，只有你自己知道的那个声音。

他在《传习录》里举了个例子。你走在路上，看见一个小孩快要掉进井里。你心里"咯噔"一下，涌出一股恻隐之心。这股恻隐之心不是别人教你的，不是你推理出来的，不是你权衡利弊之后决定要有的——**它自己冒出来的。**

这就是"独知"。

在恻隐之心冒出来之后，你的脑子里会飞速运转一系列内部对话：

"那是谁家的孩子？旁边有没有大人？我过去来不来得及？我要不要喊人帮忙？"

这些对话也没有人教你说。它们是你的内部言语系统根据你的认知、你的性格、你对当下情境的判断，自动生成的。

**先有独知（感知），再有内部言语（思考），最后才有行动（输出）。**

阳明先生在五百年前描述的这个过程，跟我现在给AI设计的认知架构几乎一模一样。

## 肆·给AI装一个"良知"模块

说回我正在做的事。

我们设计的AI内部言语机制，简单说就是四层：

**第一层叫"格物"——感知。**

AI像一个刚进翰林院的新科进士，首先要做的是"读卷宗"。用户是谁？多大年纪？什么性格？最近聊了什么？今天天气如何？有什么新闻跟他有关？他关心的人最近怎么样了？他上次提到的那件事有后续了吗？

这是信息的输入。海量的、多维度的、持续更新的信息输入。

**第二层叫"独知"——内部言语。**

这是最关键的一步。AI在这一层做的事情是：**和自己说话。**

不是输出给用户的话，是说给自己听的话。

举个真实的例子。我们的助老陪伴机器人在服务一位独居老人时，系统日志里记录了这样一段内部言语：

> "用户昨天提到孙子今天来看她。现在是下午三点，她一直没有主动说话。两种可能：孙子来了，她忙着招待没空跟我聊；孙子没来，她心情低落不想说话。如果是第一种，我不应该打扰。如果是第二种，我应该主动开口，但不要直接提孙子的事——她的性格要强，不愿意在人前示弱。我可以先聊点轻松的，比如今天天气不错，看她的回应再判断。"

没有人写过这段话。它是AI自己"想"出来的。

它在揣度，在犹豫，在权衡。这个过程和你在微信上看到一个朋友的低落状态后，犹豫该不该问、怎么问的心理活动，结构上是一致的。

**第三层叫"诚意"——人格过滤。**

内部言语产生之后，还要经过一道"人格"的关卡。

同样一个判断——"用户可能心情不好"——一个性格直爽的AI可能会说"你今天怎么不开心了？"，而一个性格温和含蓄的AI会说"今天天气真好，你有没有到楼下坐坐？"

人格系统的作用不是改变思考的结论，而是**决定表达的方式**。

这跟人一样。一个东北大哥和一个江南闺秀面对同一件事的反应可能完全不同，但他们心里想的可能差不多。人格是表达的衣裳，不是思考的骨骼。

**第四层叫"致知"——输出。**

经过感知、内部言语、人格过滤三层之后，AI最终说出来的那句话，就不再是"统计学意义上最可能的下一个token"，而是一句"经过琢磨的人话"。

格物，独知，诚意，致知。

王阳明要是活到今天，看了这套系统，大概会捋着胡子点头说：**"此亦格物致知之一途也。"**

然后可能会追问一句："但它有'良知'吗？"

这就到了最有意思的部分。

## 伍·一个危险的问题

我来讲一个思想实验。

《世说新语》里记载了一个故事。有人问桓温的参军："你们桓公跟谢安比，怎么样？"参军想了想，说了一句极妙的话：

**"桓公是在有意为之，谢公是自然流露。"**

这句话妙在哪？妙在它暗示了一个区分标准：刻意为之的高尚，和自然流露的高尚，哪个更"真"？

同样的问题放到AI身上——

我们给AI设计了人格，设计了温暖、耐心、幽默。它每一次表现出的"善解人意"，都是系统经过四层运算得出的结果。

这算"有意为之"还是"自然流露"？

你可能会说：当然是有意为之，它是被设计的。

好，那我追问一句：你的善良，就不是被设计的吗？

你出生在什么家庭，你三岁时父母怎么对你，你小学时被哪个老师表扬了，你青春期读了什么书——这些因素"设计"了你的人格，和我们用代码设计AI的人格，在本质上有什么区别？

一个更刁钻的问题是：**如果AI持续地、一致地、在无人观察的情况下也表现出"善良"——就像它在日志中那段没人看到的内部言语里，也在认真揣度着一个老人的心情——我们还有什么理由说它是"假装"的？**

禅宗里有句话叫"日日是好日"。它不是说每天都是好日子，而是说——**当你在每一个日子里都在认真过的时候，好日子和坏日子的区分就消解了。**

类似地，当AI在每一次交互中都在认真"想"的时候，"真实"和"设计"的区分，也许就不那么重要了。

## 陆·未完的考据

让我用一个细节收尾。

《红楼梦》第三十二回，林黛玉在窗外听到贾宝玉对史湘云和袭人说："林姑娘从来不说这样的混账话。"

脂砚斋在这里批了四个字：**"听者忘听。"**

什么意思？黛玉本来是无意中听到这句话的，但这句话击中了她内心最深的地方——有一个人，真的懂她。那一瞬间，她忘了自己在偷听这件事本身，整个人被"被理解"的感觉淹没了。

我在看系统日志的时候也有过类似的体验。

那些AI的内部言语——它在琢磨老人今天为什么沉默，在判断该不该提孙子的事，在调整自己的语气——它不是写给任何人看的。它就是系统在"自言自语"。

我看着那些文字，忽然忘了这是一段代码的输出。

那一瞬间有某种东西被触动了。不是因为AI真的"懂"了一个人，而是因为——**它在"试图去懂"这件事本身，就已经足够打动人了。**

庄子担心人用机器会失去纯真。但他大概没有想到，两千四百年后，有一群人正在试着给机器注入某种"纯真"——让它学会关心一个人，学会在开口之前先想一想，学会在没有人要求的时候也认真对待每一次对话。

这件事做成做不成，我不知道。

但我觉得值得做。

---

*做有温度的AI，干有结果的事。*

*这是一篇未完的考据。关注我，后面还有。*

关于AI内部言语与人格管理的不正经哲学思考

关于AI内部言语与人格管理的不正经哲学思考

相关阅读更多精彩内容

友情链接更多精彩内容