AI专题16:人有人的用处
1.人的最根本作用,是选择未来发展的方向。人必须确保自己有足够多的选项和足够大的选择权。
2.人必须和AI共存,而我们必须确保人做的都是高端工作。
3.人更高级的技能,是「调用力」、批判性思维、艺术和哲学、领导力、传播能力和说服力。
在自动化机器的时代,人到底还有啥用,这个问题其实很早以前就有人思考过,而且得出了经得起时间考验的答案。
早在1950年,控制论之父诺伯特·维纳(Norbert Wiener,1894—1964)就出了本书叫《人有人的用处》,认为生命的本质,其实是信息:我们的使命是给系统提供额外的信息。维纳这个观点直接影响了克劳德·香农(Claude Shannon,1916—2001)。香农后来发明了信息论,指出信息含量的数值,就是在多大的不确定性中做出了选择。在信息意义上,人生的价值在于争取选择权、多样性、不确定性和自由度。
别人交给你一个任务,你按照规定程序一步步操作就完成了,那你跟机器没有区别。只有这个过程中发生了某种意外,你必须以自己的方式、甚至以自己的价值观解决问题,在这件事情上留下你的印记,才能证明你是一个人,而不是一个工具。
这些思想跟沃尔夫勒姆用计算不可约性推导出来的道理是相通的:人的最根本作用,是选择未来发展的方向。那就是人必须确保自己有足够多的选项和足够大的选择权。
怎么做到这些呢?
✵
首先是约束AI。科幻小说家艾萨克·阿西莫夫(Isaac Asimov)有个著名的「机器人三定律」,规定——
第一,机器人不得伤害人类,或坐视人类受到伤害;
第二,机器人必须服从人类的命令,除非该命令与第一定律有冲突;
第三,在不违背第一或第二定律的前提下,机器人可以保护自己。
这三条定律好像挺合理,先确保了人类的安全,又确保了机器人有用,还允许机器人自我保护……那能不能就用这三条定律约束AI呢?阿西莫夫想的挺美,但是可操作性太低了。
首先,什么叫“不伤害”人类?如果AI认为暴力电影会伤害人的情感,它是不是有权不参与拍摄?为了救更多好人,把一个犯罪分子抓起来,算不算是伤害?现实是很多道德难题连人都没搞清楚,你怎么可能指望AI搞清楚呢?
机器人三定律更大的问题是把判断权交给了AI。现实中不会有任何公司会这么做。事实上,各国研发AI,优先级最高的应用就是武器,比如攻击型无人机或者战场机器人——开什么玩笑,这可是国防部的项目,伤害不伤害是你一个AI能说了算的吗?
而最根本的问题,还是沃尔夫勒姆的计算不可约性。凡是能写下来的规则都不可能真正限制住AI,这里面肯定有漏洞,将来肯定有意外。
就算道可道非常道,可我们人类社会还是有各种法律啊。没错,比如我们有宪法,我们承认宪法不可能穷尽国家未来发展会遇到的所有情况,所以我们保留了修改宪法的程序。理想情况下,对AI的约束也应当如此:我们先制定一套临时的、基本上可操作的规矩让AI遵守,将来遇到什么新情况再随时修改补充,大家商量着办。
但这么做的前提是将来你告诉AI规则修改了,AI得真能听你的才行。
计算不可约性意味着我们对AI的掌控最多只能是动态的,你无法一劳永逸地给它规定死,只能随时遇到新情况随时调整。可是,AI有它自己的思维方式,如果我们都不能理解AI,又怎么能确保掌控AI呢?
沃尔夫勒姆的判断是,认命吧。人根本不可能永远掌控AI。正确的态度是认可AI有自己的发展规律,你就把AI当成大自然:大自然是我们至今不能完全理解的,大自然偶尔还会降一些灾害给人类,像什么地震、火山爆发,也是我们所无法控制也无法预测的,但是这么多年来,我们也适应了跟大自然相处……
这就是共存。AI将来肯定会对人类造成一定的伤害,正如有汽车就有交通事故,我们认了。
虽然大自然经常肆虐,但人类文明还是存活下来了。沃尔夫勒姆说,其中的根本原因是大自然的各种力量之间、我们跟大自然之间,达成了某种平衡。那么我们将来跟AI的关系也是这样。我们希望人的力量和AI的力量能始终保持大体上的平衡,AI和AI之间也能互相制衡。
而计算不可约性定理支持这个局面。将来不会有什么超强AI一统江湖的,正如历史上从未有过万世不易的独裁政权。可能在某些短期内,会出局部的失衡,带来一些灾祸,但总体上大家的日子总能过下去……这就是我们所能预期的最好结果。
从数学上,AI一定会有别的AI来制衡。但是从实践上,如果人类太弱而AI太强,就好像神话世界一样,各个派系的AI成了大地上行走的神灵,人只能乞求这些神灵帮忙做事,那也不是我们想要的。
为了保证力量平衡,人必须继续参与社会上的关键工作。
✵
AI会逐渐抢走我们的工作吗?至少从工业革命以来的历史经验来说,不会。历史经验是自动化技术创造出来的新职业总是比消灭的职业多。
比如说,以前每打一次电话都需要有个人类接线员帮你接线,那是一份很体面的工作,给高层次女性提供了就业机会。那后来有了自动的电话交换机,不需要接线员了,电话行业的就业人数是不是就减少了呢?恰恰没有。
自动交换机让打电话变得更方便、也更便宜了,于是电话服务的需求量大大增加,这个行业整体变大了,马上又多出了各种岗位,尤其是出现了一些以前不存在的岗位,总的结果是电话行业的就业人数不但没减少,反而还大大增加了。
类似的事情在各个行业反复发生。再比如说有了计算机之后,会计师的工作在一定程度上自动化了,那会计师人数是不是减少了呢?也没有。计算机让金融服务更为普及,使用金融服务的人多了,金融业务变得越来越复杂,各种新法规、新业务模式层出不穷,现在需要更多的会计。
每个行业都是这样。经济学家已经总结出一套规律 ——
自动化程度越高,生产力就越高,产品就越便宜,市场份额就越大,消费者就越多,生产规模就必须不成比例地扩大,结果是你需要雇佣更多的员工。自动化的确会取代一部分岗位,但是它也会制造出更多的新岗位。
统计研究表明,哪怕对非熟练的制造业工人——他们被认为是最容易被自动化淘汰的人——也是如此,他们也能找到新岗位。美国自动化程度最高的行业也是就业增加最多的行业。反倒是没有充分实现自动化的公司不得不缩小就业规模,要么把生产外包,要么干脆倒闭。
这也就是说,如果哪个国家的政府说我怕AI抢人的工作,所以我要限制AI发展,拒绝自动化,那就太愚蠢了。你保护哪个行业,哪个行业就会落后,就会产品越来越贵消费者越来越少……
现在ChatGPT让编程和公文写作变容易了,Midjourney之类的AI画图工具甚至已经使得有些公司裁掉了一些插画师。但是根据历史规律,它们会创造更多的工作。
比如「提示语工程师」,也就是所谓“魔法师”,就是这几个月刚刚出现的新工种。再比如AI画作如此容易,人们就会要求在生活中各个地方使用视觉艺术。以前家家墙上挂世界名画,未来可能都挂绝无仅有的新画,而且每半小时换一幅。那么可以想见,我们会需要更多善于用AI画画的人。
既然编程变容易了,那每个公司、甚至每个小组都可以要求定制属于自己的软件。既然机器人那么能干,那我们为什么不根据家里人口变动情况,每过一段时间就把房子拆了重建,改改格局呢?
计算不可约性确保了总会有新的工作等着人去干。
✵
而我们必须确保人做的都是高端工作,把低端的留给AI。要做到这一点,我们的教育就必须保证人始终是强势的——而这恰恰不是目前为止大众教育的培养目标。大众教育的培养目标一直都是工具人。
根据沃尔夫勒姆的观点,最高级的工作,是发现新的可能性。搞科学也好搞艺术也好,能给人类创造新的可能性,你就是最先进的。
而其余的人类职业,则应该尽可能利用自动化。就是AI能做好的事儿,你就不要学着做了,你的任务是驾驭AI。这在思想上其实不太容易转过弯来,比如计算器和计算机已经把人从计算中解放出来了,但我们总觉得如果一个人不会心算一位数乘两位数、不会手动算积分,就缺了点什么……其实现在的学生应该把大脑解放出来去学习更高级的技能。
更高级的是什么呢?大约有以下这些——
一个是「调用力」。各种自动化工具都是现成的但是太多了,你得有点学识,才知道干什么事情最适合调用什么工具。就如同ChatGPT知道调用各种插件,你要想对事情有掌控感,最好多掌握一些工具。
一个是「批判性思维」。既然你要做选择,就得对这个世界是怎么回事有个基本的认识。你得区分哪些是事实,哪些是观点,哪些结论代表当前科学理解,哪些说法根本不值得讨论。你可能还需要一定的计算机思维,不是说非得编程,而是你得善于结构化、逻辑化的思考。
然后你还需要艺术和哲学。这会提高你的判断力,让你能提出好的问题。艺术修养尤其能让你善于理解他人,这样你才能知道当今社会消费者的需求是什么,乃至于想象出新的需求。
你还需要领导力。不一定非得是对人的领导力,你至少需要对AI的领导力。这包括制定战略目标、安排工作步骤、设置检验手段等等……管理AI,也是一门学问。
然后你还需要一定的传播能力和说服力。你能把一个复杂想法解释清楚吗?你能让人接受你的观点吗?你能把产品推销出去吗?高端工作很需要这些。
而所有这些智慧之中,沃尔夫勒姆认为,人最核心的一个能力,是你得决定你关心什么、你想要什么。这只有你自己能决定,因为答案来自你的历史和你的生物结构。这也是至关重要的战略选择,因为如果选不好,你的路可就走差了。
北大考试研究院院长秦春华有个感慨 。他去上海面试学生,发现他们的学习成绩、艺术特长、公益事业什么的全都是一模一样的,看起来都很完美实则没有任何特点。最可怕的是,问他们希望自己将来成为什么样的人,很少有人能答上来。
其实美国也差不多,同质化竞争之下,大量优等生都是「优秀的绵羊」。
这些人如果不开悟,几乎肯定会输给AI。你是历史的产物,你是现代教育系统的牺牲品,但你还可以独立学习和思考,你能做出更好的选择。
✵
这些都是古代贵族学的「自由技艺(liberal arts)」。你就直接把AI想象成是小人和奴隶,咱们都是君子和庄园主。我们要学的不是干活的技能,而是领导的艺术、生活的智慧。
当然历史上很多贵族是非常愚蠢的,搞不好就被人夺了权……所以要想当好贵族,你得学习。
将来的社会必定是个人人如龙的社会。孔子、苏格拉底和佛陀他们那个轴心时代之所以是轴心时代,就是因为农业技术进步把一部分人解放出来不用干活儿整天想事儿,让社会有了阶层,生活变得复杂。现在AI来得太好了,我们正好回归轴心时代,个个学做圣贤。
AI专题17:直觉高于逻辑
1.AI = 基于经验,使用直觉,进行预测。
2.说不清的神经感知,正是AI做的事情。AI的本质,就是跟人脑一样的神经计算。
3.世界将从工业复制时代重归匠人定制时代。AI会像传说中的神奇中医大夫一样给每个病人提供不同的治疗方案,而且全凭感觉治疗,而且各有各的风格。
列宁有句话说:「有时候几十年过去了什么都没发生;有时候几个星期就发生了几十年的事。」
从2022年年底以来的这大半年,确实是有恍如隔世之感。我们被AI的突飞猛进给震惊了,我们的一些观念发生了巨变。现在经过这几个月的沉淀,可能我们对一些问题会想的更清楚一些。这一番AI革命带给我们三个教训,同时还有两个展望……
先说第一个教训:直觉高于逻辑。
✵
一个最基本的认识。到底什么是AI?——
AI = 基于经验,使用直觉,进行预测。
你用以往的经验数据训练一个模型。这个模型只关心输入和输出。训练完成之后,再给它新的输入,它将给你提供相当不错的输出,你可以把这个动作视为预测。你要问模型是怎么从这个输入算出来那个输出的?回答就是说不清怎么,这是直觉。
在2022年发表的一项研究中,DeepMind的科学家做成了一件对物理学家有点降维打击的事儿:用AI控制受控核聚变装置中的等离子体形状。
下面这个装置就是用来搞磁约束核聚变的,叫托卡马克,它是一个面包圈的形状。面包圈里面那些描写成淡黄色的气体就是要参与核聚变的等离子体。在外面一道一道围着面包圈的那些黄色的线圈一通电就会在面包圈内部产生一个磁场,这个磁场将会约束住等离子体保持悬空状态,让这个气体不要撞到墙上。

你的任务是通过控制那些线圈,来调整那个磁场,从而给等离子体一个理想的形状。可是怎么控制呢?
从线圈的参数到等离子体的形状之间,隔着十万八千里复杂的计算。以前物理学家要么就直接做实验,要么就从物理学基本原理出发,老老实实做数值模拟 —— 而这两种方法都是给定线圈参数,求形状是什么。
可是你真正想要的是指定一个等离子体形状,能不能告诉我线圈得有什么样的参数才能产生这个形状。但既然从参数到形状的「正推」都那么难,这个「逆推」就更是难上加难了。
然而DeepMind使用强化学习的方法,把逆推的问题给解决了。他们能让AI非常精准地操控那些线圈,你想要个什么形状就能给你个什么形状。这个工作非常漂亮,已经得到了真实实验的证实。
……讲这么多只是为了引用DeepMind论文里的一句话:
「强化学习方法……将重点转移到应该实现什么目标上,而不是如何实现。」
这句话有多霸气呢?它的意思是说,你只说想要什么就好,不必问如何得到。
对AI来说,你只需要关心输入和输出。
✵
AI这种做事方法听起来很神奇,但其实这是世界上最自然的思维方式,因为这就是包括人脑在内,各种生物的感知方式。

因为这个世界是有秩序的,它讲理,什么事情都不会无缘无故发生,所以我们可以采纳沃尔夫勒姆的哲学,认为世间的一切演化和运动 —— 不论是行星绕着恒星转、一草一木的生长还是一块石头从高处掉下来 —— 都是计算。而我们人类为了认识世界和预测世界,就必须通过某种更简化、更快捷的计算,提前知道真实世界的计算结果。
为此我们使用了两种计算方法,一个是神经网络,一个是形式逻辑。
所谓形式逻辑,就是把问题变成数学问题进行推导。你写下方程,其中每个参数都有特定的意义,每一步推演都有明确的因果关系,你非常清楚每个中间步骤为什么要这样做,你有一个清晰的理论。形式逻辑是人类智慧的伟大发明,也是启蒙运动以来唯一正统的分析问题方法。我们所有的科学理论都是基于形式逻辑的。对任何问题、任何操作,能用形式逻辑表述清楚,你才算是真「懂」。形式逻辑代表「理性」。
从最简单的加减乘除到最复杂的计算机程序和物理学家的数值模拟,人们通常所说的“计算”的都是形式逻辑。形式逻辑要求你严格按照某些规则操作,这对人脑来说其实是很费力的。这就是为什么我们发明了计算机去代替我们执行形式逻辑的算法。
人类原本擅长的、天生就会的计算,其实是神经计算。从大脑到身体,人体是由几个神经网络组成的,它们给你提供各种感知,神经计算就是这些感知的过程。你感到饿了、认出一位朋友的脸、害怕蛇,这些都是大脑对一组身体或者外部信号的解读,解读的过程就是神经计算。神经计算没有可言说的规则,你自己无法把它分解成若干个中间步骤,也说不清都有哪些参数 —— 但你就是能感觉到,而且是快速感觉。这是跟形式逻辑截然不同的计算路线,以至于我们平时都不会把它称为计算。
神经计算和形式逻辑之间有个交集,这是因为人脑也会算些简单的数学题……但算数学题不是我们最擅长的。我们更擅长的是用神经网络直接感知一个复杂的东西。
比如说,当你看见一只猫的时候,你知道那是一只猫 —— 这个能力看似平常,却是几乎无法用形式逻辑描写的。到底是这个物体中的哪些参数让你看出来它是一只猫的?没有方程。

你只能说因为我见过一些猫,我知道猫是什么样的,所以当我看见一只猫的时候,我知道那是一只猫。
✵
这种说不清的神经感知,正是AI做的事情。AI的本质,就是跟人脑一样的神经计算。
每个AI都有一个模型,这个模型是个神经网络,它有从几百万到几千亿个参数。当我们用已知的经验去训练AI的时候,每一个案例进来,从输入到输出的反馈,都会把这些参数更新一遍,但是每次更新的幅度都非常小。训练过程中你说不清为什么这个案例会让这个参数的数值变大或者变小了那么一点点,训练完毕你也说不清每个参数的意义是什么。然后你使用AI的时候,它每一次的预测推理,都是无数个参数共同参与的过程。
这正如大脑每次想问题,都是无数个神经元共同参与的过程。这个过程之所以说不清,只是因为有太多参数参与,而不是因为它有什么内在的神秘性。
很多人抱怨AI是个黑盒子,从输入直接生成输出,说不清中间发生了什么 —— 可是人脑不也是个黑盒子吗?

你开车的时候精心计算过方向盘的角度吗?你打篮球的时候会使用公式描写出手的力度吗?这些判断其实全是神经网络感知。当你走路的时候,当你试图用手拿东西的时候,你都是根据说不清道不明的感觉做一个差不多的动作,这都是我们日用而不知的神经计算。更不用说艺术家的美感和灵感也都是如此。
只是有些时候,神经计算会让我们感到惊奇。比如一个经常抓小偷的老警察,到火车站随便扫两眼,就知道在场谁有可能是小偷。人们问他,你是怎么看出来的?我怎么就看不出来?你这个直觉真神奇!警察说无他,但手熟尔:我只不过看得多了 —— 他的神经网络在抓小偷方面受过很多次训练,而你没有。
对比之下,麻省理工学院在2020年用AI从六万多个化学分子式中找出了一种可用的抗生素,跟警察抓小偷其实没有本质区别。AI只是在训练中见多了分子式而已。
非要说区别,AI跟人脑的区别就在于人脑只适合拿我们在演化环境中熟悉的东西训练,而AI的神经网络可以用任何东西训练 —— 包括分子式、基因序列、磁场线圈参数等等等。
✵
基辛格等人对AI的赞叹。他们说AI之所以厉害不在于它“像人” —— 意思是它能做像人一样的事情 —— 而在于它*不像*人,它能感知人类既不能用理性认知,也感受不到的规律……这是启蒙运动以来未有之大变局。
现在回头看,更准确的说法还是AI*像*人。AI的感知方法跟人的感知方法别无二致,只不过比人的范围更广、速度更快、而且可以无限升级而已。
AI,比人更像人。
要这么说的话,也许启蒙运动以来形式逻辑方法的流行,人类学者对「理性」的推崇,只不过是漫长的智能演化史中的一段短暂的插曲。用神经网络直接从输入感知输出,才是更根本、更普遍、更厉害的智能。AI的出现只是让智能回归了本性。
我们意识到,形式逻辑只能用于解决简单的、参数少的、最好是线性的问题;对于真实世界中充斥的像如何控制磁场线圈才能得到特定形状的等离子体这种复杂的、参数多的、非线性的问题,你终究只能依靠神经计算。
所以我们得到的第一个教训是,直觉高于逻辑。
✵
如果AI从此大行其道,以至于神经计算在各个领域取代了形式逻辑,这对社会会有深远的影响。关键是用形式逻辑描写的知识可以一步步写下来,能被人理解,这就意味着它是可传播和可推广的。这位医生发明了一个新疗法,别的医生把他的论文找过来读一读,看看操作步骤,立即就可以在本地复现。这就叫学知识。
但神经计算却是难以推广的。这个AI发现了一种新的抗生素,你问它你是怎么做到的?我能不能用你的操作步骤发现一种消炎药呢?你不能,因为AI说不清它是怎么发现的,这里没有可以用言说的操作步骤。你唯一的办法就是用消炎药的案例重新训练一个AI。
这就意味着除了像GPT那样的语言模型,各种专用AI都是「一事一议」,是本地的,是针对每一个具体应用专门训练的。用美国数据训练出来的自动驾驶AI不能直接拿到中国用,用于操控这个托卡马克装置的AI不能操控另一个装置。
而这又意味着世界上将会有无数个AI。它们为具体的任务而生,有不同的特性,就好像一个个生命体一样。而且它们不是千篇一律的工人,他们是各有性格的工匠。
你的确不需要问这个活儿是怎么做的 —— 但是你会问是*谁*做的。每个AI都不一样,哪怕做的是同样的事,因为经历的训练不一样,它们产出也会各不相同。它们会在自己的作品上签名。
世界将从工业复制时代重归匠人定制时代。AI会像传说中的神奇中医大夫一样给每个病人提供不同的治疗方案,而且全凭感觉治疗,而且各有各的风格。
而那样一个世界,原本是我们熟悉的。
AI专题18:算力就是王道
1.AI大潮给我们的第二个教训是:算力就是王道。而2022年底以来GPT的表现,给了我们第三个教训:人是简单的。
2.近期的两个展望:一个是AGI会在所有领域参与人类工作;另一个是所有科研领域都应该用AI。
3.计算机算力的增长,目前似乎还没有衰减的迹象。摩尔定律依然强劲。
这一波AI大潮带给我们的教训和展望。人类自从进入文明社会以来,有了书本、有了读书人,我们的价值观就一直是崇尚智力而不是暴力,认为你有再强的力量都不如我有知识。现在是时候重新审视这个认识了。
人的肌肉力量是非常有限的,你就是一天吃五顿饭又能多长几斤肉。工程机械的力量可以很大很大,但是能做的事情很有限,毕竟文明需要的更多的是精细而不是大力,没有谁以“我们国家有世界最大的起重机”为荣,更何况起重机的力量也有上限。对比之下,知识似乎是无穷的,你可以无上限地使用,所以崇尚知识很有道理。
但是现在有一种力量却是无上限的,它的增长速度远远超过了任何领域中知识积累的速度。这个力量就是计算机算力。
这跟审美、跟道德都没关系,纯粹是力量的对比。在现在这个局面下,你指望知识,就不如指望算力。
第二个教训是,算力就是王道。
✵
DeepMind有一位计算机科学家叫理查德·萨顿(Richard S. Sutton),他是「强化学习」这个AI算法的奠基人之一。
早在2019年,萨顿就在他的个人网站贴出一篇文章,叫《苦涩的教训》。他说,过去70年的AI研究给我们最大的教训,就是撬动算力才是最有效的方法。
先看几段历史 ——
1997年,AI下国际象棋打败了卡斯帕罗夫,而当时大多数研究用计算机下国际象棋的科研人员对此不是感到兴奋,而是感到失望。他们原本的想法是把人类的国际象棋知识教给AI,让AI像人类棋手一样思考 —— 可是没想到,居然是一个只会大规模深度搜索的、纯粹依靠计算机的蛮力的程序最终胜出了。
这不是不讲理吗?从此一直都有人说,对国际象棋可以这么干,但是对围棋就不行了,因为围棋过于复杂……
二十年后,AlphaGo下围棋击败人类世界冠军,用的还是暴力破解。那个AI不但不懂、而且根本没学过什么围棋知识,而且它还反过来为人类创造了一些新的围棋知识。
在语音识别领域,上世纪七十年代的主流方法是把人类的语音知识 —— 什么单词、音素、声道 —— 教给计算机……结果最终胜出的却是根本不管那些知识,纯粹用统计方法自行发现规律的模型。
在计算机视觉领域,科学家一开始也发明了一些知识 —— 什么去哪里找图形的边缘、什么“广义圆柱体”等等 —— 结果那些知识也是啥用都没有,最终解决问题的是深度学习神经网络。
现在GPT语言模型更是如此:以前的研究者搞的那些知识 —— 什么句法分析、语义分析、自然语言处理(NLP)—— 全都没用上,GPT直接把海量的语料学一遍就什么都会了。
在无穷的算力面前,人类的知识都只不过是一些小聪明而已。
萨顿总结了一个历史规律,分四步 ——
1. 人类研究者总想构建一些知识教给AI;
2. 这些知识在短期内总是有用的;
3. 但是从长远看,这些人类构建的知识有个明显的天花板,会限制发展;
4. 让AI自行搜索和学习的暴力破解方法,最终带来了突破性进展。
算力才是王道,知识只是干扰。
✵
AI的暴力破解是怎么做到的呢?三种最流行的神经网络算法:监督学习、无监督学习和强化学习。现在我们经历了那么多,可以把这三种“学习”方法重新审视一遍。
监督学习(supervised learning)是最基本的神经网络算法,它需要先把训练素材打上标签,让AI知道什么是对的。它的作用是「判断」,它追求的是「是不是」。
比如让AI从一大堆分子式中判断哪个有可能是一种新型抗生素,就是监督学习。你需要事先知道抗生素大概是什么样的,为此你需要喂给AI一些现成的例子用于训练。
但是如果数据量非常大,一个一个提前标记训练素材是人力难以承受的,为此有个办法叫「自监督学习(self-supervised learning)」,让AI自己去对照答案。比如GPT语言模型的训练过程中有一部分就属于自监督学习。最简单的思路是这样的:拿过来一篇文章,先把上半部分喂给模型,让模型根据上半部分预测文章的下半部分是什么,再把真实的下半部分给它看,让它从反馈中学习。
可以说自监督学习方法进一步解放了AI的生产力。2023年8月,众多研究者在《自然》杂志联名发表了一篇综述文章,列举了当前AI在科学发现上的一系列应用,其中自监督学习起到了很大的作用。
下面这张示意图描写了AI参与新药研发的一个过程 ——

这里研究者先用自监督学习训练一个基本的AI模型。你手里有一大堆药物分子结构和实验结果的数据,但是你没有标记哪个实验结果是你想要的药物。你只需要把那些分子结构都一个个输入给AI模型,让它自己预测这个结构的实验结果,再跟数据中真实实验的结果比较,这样让它对药物结构和实验结果之间的关系有个基本印象。然后你再用有标记的少量数据对这个基本模型进行监督学习的微调,让它学会精确判断哪种结构最有可能得到我们想要的实验结果。最终的AI就可以对海量候选对象进行筛选,判断谁有可能是我们想要的新药了。
无监督学习(unsupervised learning)就更厉害了,因为它根本不需要你对训练素材进行任何预处理,你不要告诉AI你想要什么,直接一股脑地喂给AI就行,AI会自行发现素材中的规律。GPT之所以能学习天量的语料,就是主要使用了无监督学习。
无监督学习主要用于「生成」,它追求的是「像不像」。GPT生成文章、Midjourney生成照片是生成,给几块甲骨文片段让AI帮助补全龟甲中残缺的部分也是生成,给定一小段碱基对让AI生成蛋白质结构也是生成。生成性AI可以做很多事情。
强化学习(reinforcement learning)则是寻求对一些指标进行优化,让它们处于一定的范围之内,它的作用是「控制」,它追求的是「好不好」。像下围棋、自动驾驶、包括用AI控制核聚变等离子体构型,都是强化学习。
这些方法的本质都是用一定的输入输出数据训练一个神经网络,再用这个神经网络读取新的输入并生成输出。在这个过程中你眼中可以只有数据:你甚至不需要关心那些数据出自哪个学科,不知道它们的物理意义是什么……
2023年8月,马斯克展示了特斯拉最新版的自动驾驶AI(FSD Beta V12)。这一版的特点是整个程序中没有一行代码告诉AI遇到减速带慢行、避让自行车、交通信号是什么意思等等 —— 系统没有注入任何交通规则,神经网络自己从输入到输出悟出来了一切。
这些方法的细节是相当精巧的,但是跟任何学科的人类知识相比,这些绝对是非常简单的方法。这些方法之所以厉害,根本性的原因是算力:是超强的运算速度和便宜而海量的数据存储成就了这一切。
✵
在算力的加持之下,2022年底以来GPT的表现,给了我们第三个教训:人是简单的。
GPT-3有1750亿个参数。OpenAI没有公布,但是网上传说GPT-4有1.8万亿个参数。这些无疑是非常大的数字,但是在指数增长的算力面前,这些是有限的数字。而就是这样有限的模型,竟然就抓住了人类几乎所有平常的知识。
GPT-4有人类的常识,能看懂照片,它能做包括编程和写作在内人能做的很多事情,它懂的比任何人都多……它就是AGI。它是一个语言模型,它是用语料训练出来的,但是不知怎么,它抓住了语言背后的、难以言传的东西。它可以用语言表达一些我们人类还没有来得及用语言表达的东西。
AI语言、AI画图、AI判断和AI控制,做的是不一样的事情但是基本原理是一样的。为什么?沃尔夫勒姆对此的洞见是,AI只是抓住了“像人”的东西。
而这说明「人」其实是简单的。简单到这么有限的算力就能把你搞明白。「人」究竟是什么?我们能不能借助AI对人有个突破性的新认识?
这肯定意味着一些更大的可能性,但是我们现在所能看到的,是近期有两个展望。
✵
一个是AGI会在所有领域参与人类工作。
当前国内外主流公司都专注于搞自己的大模型,但是对模型的应用还远远没有展开。这可能是因为当前AI算力还太贵,GPT一次能记住的用户本地信息还很有限,不容易搞强烈量身定制的服务。
不过已经有人在做了。一个临时性的办法是把本地信息“矢量化”,也就是进行某种程度的压缩,让GPT能多记住一些;但更根本的办法是把GPT拿过来用本地信息微调。最近OpenAI已经开放了GPT-3.5的微调服务。
所以会很快看到像个人助手、家庭医生、一对一家教之类切实为你量身定制、掌握专业知识的AI服务,那才是真正改变生活方式。
✵
另一个展望是所有科研领域都应该用AI。
DeepMind做的事情,基本上等于手里拿着个大规模杀伤性武器,对各个科研领域进行碾压式的打击。除了被广泛报道的围棋、电子游戏、蛋白质折叠、天气预报、包括我们前面讲的控制核聚变等离子体,他们近期还用AI帮助破解了2500年前用楔形文字写成的文本,还开始帮数学家证明定理了 ……
还有哪个领域是DeepMind不能进的?他们不是不能进,而是暂时来不及进。DeepMind就如同当初孟子梦想的那个「王道」之师,「东面征而西夷怨,南面征而北狄怨」:他们杀向生物学的时候,物理学家说你们怎么还不过来解决我们的问题,他们杀向考古学的时候,数学家说我们也能用上AI啊!
请问历史上还有哪个东西是这样的?
可能是因为算力还比较贵,更可能是因为大多数人还没学会训练AI,现在的局面是少数会用AI的人四处挑选科研课题做。但是下一步,必定是各路科研人员自己学会用AI,大杀器必定扩散。
如果我是个理工科研究生,我现在立即就要自己学着训练一个AI模型。趁着大多数人还不会用,这是一个能让你在任何领域大杀四方的武器。
✵
世间几乎所有力量的增长都会迅速陷入边际效益递减,从而变慢乃至于停下来,于是都是有上限的。唯独计算机算力的增长,目前似乎还没有衰减的迹象。摩尔定律依然强劲。
如果这个世界真有神,算力就是神。
你要理解这个力量,拥抱这个力量,成为这个力量。