日新录（3月13日晴）

图片发自简书App

哲学笔记（二）

图灵测试一词来源于计算机科学和密码学的先驱阿兰·麦席森·图灵写于1950年的一篇论文《计算机器与智能》。阿兰·麦席森·图灵1950年设计出这个测试，其内容是测试人在与被测试者(一个人和一台机器)隔开的情况下，通过一些装置（如键盘）向被测试者随意提问。问过一些问题后，如果被测试者超过30%的答复不能使测试人确认出哪个是人、哪个是机器的回答，那么这台机器就通过了测试，并被认为具有人类智能。

1950年图灵来到曼彻斯特大学任教，同时还担任该大学自动计算机项目的负责人。就在这一年的十月，他又发表了另一篇题为《机器能思考吗？》的论文，成为划时代之作。也正是这篇文章，为图灵赢得了一顶桂冠——“人工智能之父”。在这篇论文里，图灵第一次提出“机器思维”的概念。他逐条反驳了机器不能思维的论调，做出了肯定的回答。他还对智能问题从行为主义的角度给出了定义，由此提出一假想：即一个人在不接触对方的情况下，通过一种特殊的方式，和对方进行一系列的问答，如果在相当长时间内，他无法根据这些问题判断对方是人还是计算机，那么，就可以认为这个计算机具有同人相当的智力，即这台计算机是能思维的。这就是著名的“图灵测试”(Turing Testing)。当时全世界只有几台电脑，其他几乎所有计算机根本无法通过这一测试。但图灵预言，在20世纪末，一定会有电脑通过“图灵测试”。目前为止还没有电脑通过图灵测试。

要分辨一个想法是“自创”的思想还是精心设计的“模仿”是非常难的，任何自创思想的证据都可以被否决。图灵试图解决长久以来关于如何定义思考的哲学争论，他提出一个虽然主观但可操作的标准：如果一台电脑表现（act）、反应（react）和互相作用（interact）都和有意识的个体一样，那么它就应该被认为是有意识的。消除人类心中的偏见，图灵设计了一种“模仿游戏”即图灵测试：远处的人类测试者在一段规定的时间内，根据两个实体对他提出的各种问题的反应来判断是人类还是电脑。通过一系列这样的测试，从电脑被误判断为人的几率就可以测出电脑智能的成功程度。图灵预言，到2000年将会出现足够好的电脑，能够在不超过7成人的长达5分钟的提问中全部回答正确。成功通过图灵测试的电脑还没有，但已有电脑在测试中“骗”过了测试者。最终将会出现能够骗过大多数人的电脑吗？前几年IBM公司研制的计算机“深蓝”与国际象棋世界冠军卡斯帕罗夫进行的那场人机大战，最终以“深蓝”战胜卡斯帕罗夫而宣告结束，让我们不得不佩服图灵的天才预言。现代计算机之父冯·诺依曼生前曾多次谦虚地说：如果不考虑查尔斯·巴贝奇等人早先提出的有关思想，现代计算机的概念当属于阿兰·图灵。冯·诺依曼能把“计算机之父”的桂冠戴在比自己小10岁的图灵头上，足见图灵对计算机科学影响之巨大。

尤金·古斯特曼（Eugene Goostman）是由俄罗斯人 Vladimir Veselov（现居美国）开发的智能软件，模仿的是一位 13 岁的男孩。在图灵测试 2012 上，尤金就获得了第一名，当时的成绩是 29.2%，距离通过图灵测试仅一步之遥。而在2014年6月7日（也是1954年图灵去世的那天）举行的共有 5 台超级计算机参赛的图灵测试竞赛上，尤金设法让测试人相信被测试者 33% 的答复为人类所为。这意味着这台超级计算机通过了图灵测试。雷丁大学的客座教授 Kevin Warwick 说，尽管此前曾有人声称图灵测试已经得到通过，但是相比之下，这次活动的标准是最为严格的，没有对问题做任何预设。因此，他们自豪地宣布图灵测试首次获得通过。

一种测试机器是不是具备人类智能的方法。如果说有一台电脑，其运算速度非常快、记忆容量和逻辑单元的数目也超过了人脑，而且还为这台电脑编写了许多智能化的程序，并提供了合适种类的大量数据，使这台电脑能够做一些人性化的事情，如简单地听或说，回答某些问题等。那么，我们是否就能说这台机器具有思维能力了呢?或者说，我们怎样才能判断一台机器是否具存了思维能力呢?

为了检验一台机器是否能合情理地被说成在思想，人工智能的始祖阿兰·图灵提出了一种称作图灵试验的方法。此原则说：被测试的有一个人，另一个是声称自己有人类智力的机器。测试时，测试人与被测试人是分开的，测试人只有通过一些装置（如键盘）向被测试人问一些问题，这些问题随便是什么问题都可以。问过一些问题后，如果测试人能够正确地分出谁是人谁是机器，那机器就没有通过图灵测试，如果测试人没有分出谁是机器谁是人，那这个机器就是有人类智能的。还没有一台机器能够通过图灵测试，也就是说，计算机的智力与人类相比还差得远呢。比如自动聊天机器人。同时图灵试验还存在一个问题，如果一个机器具备了“类智能”运算能力，那么通过图灵试验的时间会延长，那么多长时间合适呢，这也是后继科研人员正在研究的问题

图灵采用“问”与“答”模式，即观察者通过控制打字机向两个测试对象通话，其中一个是人，另一个是机器。要求观察者不断提出各种问题，从而辨别回答者是人还是机器。图灵还为这项测试亲自拟定了几个示范性问题，图灵指出：“如果机器在某些现实的条件下，能够非常好地模仿人回答问题，以至提问者在相当长时间里误认它不是机器，那么机器就可以被认为是能够思维的。”从表面上看，要使机器回答按一定范围提出的问题似乎没有什么困难，可以通过编制特殊的程序来实现。然而，如果提问者并不遵循常规标准，编制回答的程序是极其困难的事情，你多半会想到，面前的这位是一部笨机器。或者，你面前的这位，大概是人而不是机器。上述两种对话的区别在于，第一种可明显地感到回答者是从知识库里提取简单的答案，第二种则具有分析综合的能力，回答者知道观察者在反复提出同样的问题。“图灵测试”没有规定问题的范围和提问的标准，如果想要制造出能通过试验的机器，以我们的技术水平，必须在电脑中储存人类所有可以想到的问题，储存对这些问题的所有合乎常理的回答，并且还需要理智地作出选择。

图灵测试更多是一个哲学思考，一个思维实验。它考虑的是：一个智能只能由其他智能来识别。但我们没办法给出一个示范性的问题列表，因为一旦给出，我们就可以按此设计回答。事实上，每个人（就狭隘地定义智能为人类吧）对于智能的理解都不同。有些人可能觉得会解数学题就算是了，有些人还要求智能有自我学习的能力……但图灵测试显然没有展开讨论这些情况。图灵测试更多的是一个概念，一种思考，实用性差。测试一个系统是否智能应该有更好的准则，而我们甚至都没有一个广泛认同的、可操作的准则。这也反映一个困局：我们试图创造智能，但我们连智能应是怎样都不知道。

日新录（3月13日晴）

日新录（3月13日晴）

相关阅读更多精彩内容

友情链接更多精彩内容

日新录（3月13日 晴）

相关阅读更多精彩内容

友情链接更多精彩内容

日新录（3月13日晴）