《柏拉图和技术呆子》5:大脑的字里行间
人脑的阅读和机械化的信息输入有本质区别。人脑可以从字里行间体验文字以外的东西。所有阅读都结合脑补 —— 所有解码都带有补偿。
阅读就是个主观的行为。“主观”,就是可数的语句背后那些不可数的意思。
继续用计算机的眼光审视真实世界。计算机只能处理可数的东西,可以说是建立在有理数之上的。而真实世界,则有可能是 —— 也有可能不是 —— 建立在实数上的。
哥德尔不完备性定理真的值得你用一辈子的时间慢慢把玩。我们不会纠缠这个定理的细节,但是我们要发挥一个意思。不管你的兴趣是科学、哲学还是艺术,归根结底都会落到这个意思上。
1.笑话有有限多还是无限多?
问一个问题:这个世界上的笑话,是只有有限多个呢,还是有无限多个?
所谓笑话就是用几百个字写成的一篇短文,让人读了觉得很好笑的那种东西。直觉上你可能觉得笑话应该有无限多个,世界一直在演变,每个时代都总能发现新的好笑的东西来,对吧?可是你只要想想数学,笑话显然应该只有有限多个。
这个道理是这样的。首先笑话必须得是写得比较短的,不能你讲半小时才把别人说乐。可以规定,笑话必须得是在两千汉字之内的文字。我们知道汉字的个数是有限的,大概是四千到六千个,就当有一万个吧。那从这10000个汉字中选出2000个,允许重复,进行排列组合形成文章,请问一共有多少种不同的方法呢?
最多有10000的2000次方种。其实具体的计算方法和结果不重要,重要的是答案肯定是有限多种。
所以笑话只有有限多种。其实不光是笑话,诗歌、散文,只要你限定字数,它就是有限的。当然这个“有限”是一个极大的数字,可能就算每秒读一个笑话,一直读到人类文明终结了也读不完……但是在理论上,只有有限多个笑话。
大概在十多年以前,我在博客上写下了这个说法。我想说的是其实所有笑话都已经存在了,只不过等着作家去把它们挑选出来而已。
但是有一位读者留言,提出了一个反对的观点。他这个观点非常非常高级。
他说这并不能说明笑话只有有限多个。同样一篇文字,每个人 get 到的笑点可以是不一样的。文字是有限的,但是文字背后的*意思*是无限的。不同的人对同一段笑话的解读可以千变万化 —— 所以这么说来,笑话还是无限多的。
所以写作是个双向的交流,你看我有时候就是从读者那里学到东西。他说的的确有道理。其实你想想,音乐就是如此。曲谱无非就是音符的排列组合,所以你完全可以说乐曲只有有限多首 —— 但其实不然,因为同样的乐谱到不同的演奏者手中可以千变万化。考虑到演奏方法的变化无穷,我们大概可以说曲谱是有限的,但音乐是无限的。
……当然,如果你相信数字宇宙假设,这里所谓的“无限”也只是一个错觉。数字宇宙里的乐器有有限的分辨率,所以乐曲的细微变化仍然是有理数的、可数的和有限的 —— 就好像非常高保真的数字唱片一样。
但是纠结于数字宇宙假设没意思 —— 目前这只是一个信仰。现在不妨*假装*真实世界是个实数世界,我们看看能得到什么。
2.处理实数的机器
如果我相信真实世界是实数的,那么就有很多机器不像计算机那样只能处理有理数 —— 事实上,绝大多数“机器”都能处理实数。
Lee 举了个例子,比如说,气球。你把气球充满气,它就变成了一个球形。如果气球的直径是1米,它的周长就会是π米。你可以把气球当成一个计算器,它帮你计算了π —— 而π是一个无理数!气球,是一台可以计算无理数的机器。
那你可能又要抗议了。你说这不对啊,测量总是有误差的,我不管怎么测量也不可能从一个气球上测量出真正的圆周率!没错。但Lee说这没关系,要点在于气球有一个周长,这个周长的本质是个无理数 —— 至于你能不能测量,那是另一回事儿,那是你测量手段的限制,气球对此不负责任。
这个道理在于,哪怕你测量出来的输入和输出都是有理数,这个机器的本质也可以是实数的。有理数是你对世界有限的观测,而世界的本质是实数。
输入和输出的东西都是可数的,但内部却有些不可数的东西:还有一个机器似乎也符合这个条件,那就是人的大脑。
3.大脑能编码吗?
现在有很多人相信大脑只是一台普通的计算机。比如你考察大脑内部的思维过程,无非就是脑神经元之间的连接,而神经元连接本质上是个二进制过程 —— 或者激发、或者不激发,对吧?这不跟开关一样吗?也许人脑也是一个开关网络,跟普通计算机没有本质区别。
再比如说 DNA。DNA 的遗传编码是用碱基对实现的,碱基只有四种,所以我们完全可以说 DNA 是一个四进制的数字信息编码。那也就是说,遗传信息是可数的。大脑,是从可数的 DNA “种子”生长起来的。
可要是据此就说大脑的一切活动都是可数的,我们总觉得哪里不对。
我们想想。所谓“可数”,就是像我们前面说的偶数、有理数和全体计算机程序那样,一个一个地列举下来。DNA 的确是可数的,写成文字符号的笑话、诗歌和乐谱也的确都是可数的,它们都可以按照同样的方式一一列举出来。
但是人的心灵、意识、自我的感知、智慧和知识,这些也能写成代码一一列举吗?
你要问我都有哪些想法,我无法一一列举。你要问我对一处美景的感想,我可能给你说一大堆话,但是不管说多少,我总会觉得有些感想无法写成文字。这也许是我能力不行,也许是现有的文字数量不够 —— 但也许,是大脑内部的有些活动是不可数的。
也许大脑不仅仅是一个开关网络。我们知道药物可以控制大脑,营养也对大脑也有影响,后天的经历、环境都对大脑都有细微的影响。这些影响是怎么体现到思维上的?也许大脑不仅仅是神经元的二进制活动。
当然这些都是猜测。但如果我们假设大脑是个实数机器,内部有不可数的活动,那么根据前面说的香农信息论,大脑活动就是不可编码的。对大脑的任何观测结果,都必然有噪音和误差。
遗传信息可以编码,而大脑不可编码,这就意味着一个人不可能把他的所有知识和智慧遗传给子孙后代。这个结论好像没什么,我们本来也知道不可能都遗传。但是这也意味着,大脑活动是不可复制的!
那也就是说意识无法上传。不管你怎么扫描大脑,你都只能得到有噪音的信息,你在编码过程中一定会出现失真,你永远无法记录大脑的全部活动。你的记录就好像是人的日记 —— 他写下的文字再多,也总会有些东西没有写,有些文字无法描述的东西。
如果是这样的,那我们就找到了人脑和计算机之间的一个本质区别。这个区别就是计算机只能处理可数的、数字化的东西,而人脑的思维过程是不可数的。
说白了,就是人脑中有一些“只可意会、不可言传”的东西!
艺术家完全理解什么叫“只可意会、不可言传”。诗人会故意不把事情说得太细,画家会故意留白,这大约就是他们知道可数的语言和明确的笔画都有误差,并不能真实反映人的思想。还不如留下空白不测量,让读者 —— 作为一个人 —— 去自己“脑”补。
所以人脑的阅读和机械化的信息输入有本质区别。人脑可以从字里行间体验文字以外的东西。所有阅读都结合脑补 —— 所有解码都带有补偿。
我们经常说“主观”,阅读就是个主观的行为。到底什么是“主观”?主观就是可数的语句背后那些不可数的意思!
***
在数字宇宙假设的眼光下,这一切都只是假说。也许大脑真的有些不可数的活动,但也许只是大脑活动的分辨率实在太高,以至于让我们*感觉*它不可数 —— 其实只是“很难数”而已!
但是别急,接下来我们有一个特别强的理由,来说明为什么不可数的大脑要比可数的大脑好得*多* —— 因为可数的大脑,不管分辨率多高,都有个本质的缺陷。
这就是哥德尔不完备性定理。
《柏拉图和技术呆子》6:哥德尔不完备性定理的世界观
计算机系统本质上是一些可数的东西,符合哥德尔不完备性定理的条件。
如果真实世界是实数的,人脑不是计算机,那我们就有可能随时跳出任何能写成文字的认知系统。我们永远都有一个只能意会、不可言传的思路。
实数的世界是我们用语言所无法穷尽的。
“数字宇宙假设”,这是一个不可证伪的假说,也许我们就是生活在一个有限分辨率的、可数的、可以完全用计算机模拟的数字宇宙之中。但是要说明这种宇宙的一个本质缺陷 —— 而你会因此希望我们最好还是生活在一个实数世界之中。
这个关键思想就是“哥德尔不完备性定理”。
1.“终极数学”的终结者
数学家研究问题的方法,跟科学家存在本质区别。科学家通过观察世界总结出来的规律常常有可能是错的 —— 但是数学家没有这种担心。数学家得出的结论都不是“总结”出来的,而是“证明”出来的,是建立在坚实的逻辑基础之上。
比如你考察了几个直角三角形,发现它们的直角边的平方和都正好等于斜边的平方,那你能据此就认为这是直角三角形的普遍性质吗?不能。必须用严格的数学推导*证明*这个性质。证明了,才能把它称为勾股“定理”。
那证明定理的依据都是什么呢?有的是之前已经被人证明了的定理。那最初的定理是从哪来的呢?最初的定理就不叫定理了,叫“公理”。公理无需证明,是人们普遍认可的东西。
比如说,“两点之间只能有一条直线”,这就是一条公理。
数学家先认可几条公理,然后在公理的基础之上证明各种定理,数学大厦就算建立起来了。比如我们初中学的欧氏几何学,总共才只有五条公理。决定几何学大厦的不是那些五花八门的定理,而是这五条公理。
证明一个数学定理常常需要巧妙的构思,有时候非常困难。那么在20世纪初的时候,有些数学家就有一个野心,能不能找到一个机械化的方法,能够从最基本的数学公理出发,自动证明所有的数学定理!
当时数学家重点考虑的是有关自然数的理论体系。比如哥德巴赫猜想就是有关自然数的一个论断,那数学家说,有没有一个机械化的方法,自动判断哥德巴赫猜想到底正不正确。如果这个方法找到了,那就没有后来的陈景润、也没有其他数学家什么事儿了,什么漂亮的证明都会被机械化方法无情碾压!等于是这帮人要抢后世所有数学家的风头。
数学家们努力了一番,貌似也取得了一些进展,人们充满雄心壮志。
可是1931年的一次会议上,一个25岁的年轻人,哥德尔,做了一个报告,说他证明了一个有关自然数公理系统的定理。据说当时冯·诺依曼就在报告现场,冯·诺依曼听完哥德尔的报告之后说了一句话:“全完蛋啦(It’s all over)!”
下面这张图是一本漫画书(Logicomix)中的一页,表现了当时哥德尔报告的情景 ——

简单地说,哥德尔证明了,在自然数的公理系统中,不但你们想要的那种机械化的证明不存在 —— 而且对有些命题来说,连“证明”本身,都根本就不存在!
这就是“哥德尔不完备性定理”。这个定理说,只要自然数的公理系统只有有限条公理,那么就一定存在一些命题,你既不能用这些公理证明它是对的,也不能判断它是错的。
也就是自然数的公理系统是*不完备*的。数学家的整个世界观都崩塌了。
2.误解
在大幅度地引申这个定理的含义之前,先小心一点,澄清一下人们对哥德尔不完备性定理的误解。有些人认为哥德尔证明了*一切*有限的公理系统都是不完备的 —— 这可就错了。不完备性定理只限于自然数系统。
事实上,有一个数学家叫阿尔弗雷德·塔斯基(Alfred Tarski),他在1948年就证明了,如果是一个封闭的*实数*系统,那它就有可能是完备的、也是自洽的。比如欧氏几何就是一个关于实数的系统,塔斯基已经证明,欧氏几何系统 —— 虽然仅有五条公理 —— 是完备的和自洽的。
所以千万不要滥用哥德尔不完备性定理。
3.霍金的感悟
但是哥德尔不完备性定理的确说了,对自然数这个领域来说,你真的不能从有限的几条公理出发,推导出整个大厦。自然数世界里永远都有新东西等着你。
2002年,霍金在北京参加一个物理学家的大会,他在会上做了个领导讲话式的报告,就叫《哥德尔与M理论》[1]。我们知道物理学家都在追求一个“统一理论”,希望能够一举揭示这个宇宙的终极秘密。但是在这个报告里,霍金把物理学理论和哥德尔不完备性定理做了一个类比,他说“也许要以有限数量的命题来阐述宇宙终极理论是不可能的。这和哥德尔不完备性定理非常相似。”
换句话说,霍金觉得,也许物理定律就好像自然数的公理集合一样,有多少条都不够。当然物理定律跟自然数的公理系统还是不一样的,为什么物理定律不是像欧氏几何一样是个完备系统呢?所以霍金这里只不过是表达了一种可能性而已。
但是这种可能性也许是个好消息。如果没有终极理论,我们对世界的探索就永远都不会停止。
4.内涵
既然霍金都说了,那我们也可以做一点推广。
所有可数的系统都等价于自然数系统。那么哥德尔不完备性定理的本质就是说,一个可数系统自己,是说明不了自己的。
打个比方,假设你作为新员工入职了一家公司。老板说我们是一家成熟的公司,一切行为都有章可循。这里有一本手册,你拿回去好好学习。以后不管遇到什么情况都要对照手册行动:手册说该做的你就做,手册说不该做的你就不做。
你一看这本手册非常厚,上面密密麻麻写了好几千条规定。老板非常得意。
要是哥德尔遇到这家公司,他马上就会告诉老板 —— 总会有一些行动是既属于你们公司的活动范畴,又是你这本手册无法判断它是对是错的!
(事实上,哥德尔加入美国国籍的时候,官员让他谈谈对美国宪法的看法,他就指出了宪法中的逻辑缺陷……)
有些事情,你必须得跳出手册之外,才能判断它对不对。
计算机算法是可数的。那仅用计算机算法的各种规则,能对所有算法做出判断吗?不能。有时候你必须跳出算法之外去看算法。可是如果宇宙就是个计算机,你又怎么可能跳出算法之外呢?
5.语言的局限
哥德尔不完备性定理给学术界开一个巨大的脑洞。后来有人证明了一个类似的理论 ,说任何一个可以写下来的语言系统,其中总会有一些语句,你用这个语言系统本身是无法判断其对错的,你必须得跳出这个语言才能判断。
也就是说,如果你全部的思考都被限制一种语言里的话,有些事儿对你来说就永远不知道怎么做决定。你得跳出这个语言才行。你得有一些在这种语言之外的意思才行。
所以不管多么精细的语言,都是不完备的。
如果大脑是个实数系统,那我们有些思维就是不可数的,就不能完全用任何一种语言描述。那如此说来,我们就有可能跳出这个语言,用“只可意会不可言传”的思维做出高级的判断。
这就是为什么实数宇宙比数字宇宙好。
任何一个语言的句子都是可数的,所以每个语言都是不完备的。文字是可数的,但文字背后的意思可以是不可数的。但如果你的思维是不可数的,你就总是可以创造一个新的语言去描写那些可以感知到、但无法用旧的语言描写的东西。而 Lee 认为,新语言的种类也许是不可数的。
当一台盯着手册看的 AI 不知道怎么办好的时候,因为你的思维不可数,你可以跳出手册做决定。
考虑到哥德尔不完备性定理,我拒绝接受有可能让我盯着手册看不知道怎么办好的设定。
***
总结一下。计算机系统本质上是一些可数的东西,符合哥德尔不完备性定理的条件。
哥德尔不完备性定理说,在这样一个封闭系统中,总有一些语句是这个系统本身所无法判断对错的。这就意味着如果我们身处的是一个数字宇宙,如果我们的大脑都是计算机,那迟早有一天,我们会发现对这个系统我们能想明白的东西都已经想明白了,剩下的都是永远都不可能想明白的。
从那一天开始,我们将永远浑浑噩噩地活着。
但如果真实世界是实数的,人脑不是计算机,那我们就有可能随时跳出任何能写成文字的认知系统。我们永远都有一个只能意会、不可言传的思路。
我们可以不断地跳出旧系统,探索新知识、发明新语言,建立新系统。科学家永远可以琢磨新的物理定律,艺术家永远可以创造新的意境,工程师永远可以发明新的模型。
实数的世界是我们用语言所无法穷尽的。这大约有点像咱们中国人说的“道可道非常道”。
写到这里我又想起来一句中国话叫“纸短情长”,似乎也符合哥德尔不完备性定理的精神:不管我写多长都无法表达对你的……知识服务,那就把这本书的解读暂时停在这里,剩下的都尽在不言中吧。