哲学笔记(二)
图灵测试一词来源于计算机科学和密码学的先驱阿兰·麦席森·图灵写于1950年的一篇论文《计算机器与智能》。阿兰·麦席森·图灵1950年设计出这个测试,其内容是测试人在与被测试者(一个人和一台机器)隔开的情况下,通过一些装置(如键盘)向被测试者随意提问。问过一些问题后,如果被测试者超过30%的答复不能使测试人确认出哪个是人、哪个是机器的回答,那么这台机器就通过了测试,并被认为具有人类智能。
1950年图灵来到曼彻斯特大学任教,同时还担任该大学自动计算机项目的负责人。就在这一年的十月,他又发表了另一篇题为《机器能思考吗?》的论文,成为划时代之作。也正是这篇文章,为图灵赢得了一顶桂冠——“人工智能之父”。在这篇论文里,图灵第一次提出“机器思维”的概念。他逐条反驳了机器不能思维的论调,做出了肯定的回答。他还对智能问题从行为主义的角度给出了定义,由此提出一假想:即一个人在不接触对方的情况下,通过一种特殊的方式,和对方进行一系列的问答,如果在相当长时间内,他无法根据这些问题判断对方是人还是计算机,那么,就可以认为这个计算机具有同人相当的智力,即这台计算机是能思维的。这就是著名的“图灵测试”(Turing Testing)。当时全世界只有几台电脑,其他几乎所有计算机根本无法通过这一测试。但图灵预言,在20世纪末,一定会有电脑通过“图灵测试”。目前为止还没有电脑通过图灵测试。
要分辨一个想法是“自创”的思想还是精心设计的“模仿”是非常难的,任何自创思想的证据都可以被否决。图灵试图解决长久以来关于如何定义思考的哲学争论,他提出一个虽然主观但可操作的标准:如果一台电脑表现(act)、反应(react)和互相作用(interact)都和有意识的个体一样,那么它就应该被认为是有意识的。消除人类心中的偏见,图灵设计了一种“模仿游戏”即图灵测试:远处的人类测试者在一段规定的时间内,根据两个实体对他提出的各种问题的反应来判断是人类还是电脑。通过一系列这样的测试,从电脑被误判断为人的几率就可以测出电脑智能的成功程度。图灵预言,到2000年将会出现足够好的电脑,能够在不超过7成人的长达5分钟的提问中全部回答正确。成功通过图灵测试的电脑还没有,但已有电脑在测试中“骗”过了测试者。最终将会出现能够骗过大多数人的电脑吗?前几年IBM公司研制的计算机“深蓝”与国际象棋世界冠军卡斯帕罗夫进行的那场人机大战,最终以“深蓝”战胜卡斯帕罗夫而宣告结束,让我们不得不佩服图灵的天才预言。现代计算机之父冯·诺依曼生前曾多次谦虚地说:如果不考虑查尔斯·巴贝奇等人早先提出的有关思想,现代计算机的概念当属于阿兰·图灵。冯·诺依曼能把“计算机之父”的桂冠戴在比自己小10岁的图灵头上,足见图灵对计算机科学影响之巨大。
尤金·古斯特曼(Eugene Goostman)是由俄罗斯人 Vladimir Veselov(现居美国)开发的智能软件,模仿的是一位 13 岁的男孩。在图灵测试 2012 上,尤金就获得了第一名,当时的成绩是 29.2%,距离通过图灵测试仅一步之遥。而在2014年6月7日(也是1954年图灵去世的那天)举行的共有 5 台超级计算机参赛的图灵测试竞赛上,尤金设法让测试人相信被测试者 33% 的答复为人类所为。这意味着这台超级计算机通过了图灵测试。雷丁大学的客座教授 Kevin Warwick 说,尽管此前曾有人声称图灵测试已经得到通过,但是相比之下,这次活动的标准是最为严格的,没有对问题做任何预设。因此,他们自豪地宣布图灵测试首次获得通过。
一种测试机器是不是具备人类智能的方法。如果说有一台电脑,其运算速度非常快、记忆容量和逻辑单元的数目也超过了人脑,而且还为这台电脑编写了许多智能化的程序,并提供了合适种类的大量数据,使这台电脑能够做一些人性化的事情,如简单地听或说,回答某些问题等。那么,我们是否就能说这台机器具有思维能力了呢?或者说,我们怎样才能判断一台机器是否具存了思维能力呢?
为了检验一台机器是否能合情理地被说成在思想,人工智能的始祖阿兰·图灵提出了一种称作图灵试验的方法。此原则说:被测试的有一个人,另一个是声称自己有人类智力的机器。测试时,测试人与被测试人是分开的,测试人只有通过一些装置(如键盘)向被测试人问一些问题,这些问题随便是什么问题都可以。问过一些问题后,如果测试人能够正确地分出谁是人谁是机器,那机器就没有通过图灵测试,如果测试人没有分出谁是机器谁是人,那这个机器就是有人类智能的。还没有一台机器能够通过图灵测试,也就是说,计算机的智力与人类相比还差得远呢。比如自动聊天机器人。同时图灵试验还存在一个问题,如果一个机器具备了“类智能”运算能力,那么通过图灵试验的时间会延长,那么多长时间合适呢,这也是后继科研人员正在研究的问题
图灵采用“问”与“答”模式,即观察者通过控制打字机向两个测试对象通话,其中一个是人,另一个是机器。要求观察者不断提出各种问题,从而辨别回答者是人还是机器。图灵还为这项测试亲自拟定了几个示范性问题,图灵指出:“如果机器在某些现实的条件下,能够非常好地模仿人回答问题,以至提问者在相当长时间里误认它不是机器,那么机器就可以被认为是能够思维的。”从表面上看,要使机器回答按一定范围提出的问题似乎没有什么困难,可以通过编制特殊的程序来实现。然而,如果提问者并不遵循常规标准,编制回答的程序是极其困难的事情,你多半会想到,面前的这位是一部笨机器。或者,你面前的这位,大概是人而不是机器。上述两种对话的区别在于,第一种可明显地感到回答者是从知识库里提取简单的答案,第二种则具有分析综合的能力,回答者知道观察者在反复提出同样的问题。“图灵测试”没有规定问题的范围和提问的标准,如果想要制造出能通过试验的机器,以我们的技术水平,必须在电脑中储存人类所有可以想到的问题,储存对这些问题的所有合乎常理的回答,并且还需要理智地作出选择。
图灵测试更多是一个哲学思考,一个思维实验。它考虑的是:一个智能只能由其他智能来识别。但我们没办法给出一个示范性的问题列表,因为一旦给出,我们就可以按此设计回答。事实上,每个人(就狭隘地定义智能为人类吧)对于智能的理解都不同。有些人可能觉得会解数学题就算是了,有些人还要求智能有自我学习的能力……但图灵测试显然没有展开讨论这些情况。图灵测试更多的是一个概念,一种思考,实用性差。测试一个系统是否智能应该有更好的准则,而我们甚至都没有一个广泛认同的、可操作的准则。这也反映一个困局:我们试图创造智能,但我们连智能应是怎样都不知道。