Zero To AI 中文版---第1章 AI简介

本章包括：

获取关于AI历史的观点

理解机器学习与AI的关系

探索人工智能应用爆炸的驱动因素

人工智能(AI)并不是一项新技术。几十年来，计算机科学家尝试了不同的方法来达到计算的holy grail(圣杯)：智能机器。虽然我们距离复制人脑的奇迹还有很长的路要走，但AI应用程序已经开始充斥我们的日常生活，并为我们的电子设备提供动力，从智能手机到家庭报警系统等等。

为什么会发生这种看似突然的爆发？这一章将通过向你介绍现代AI来回答这个问题，包括它背后的核心原则，以及我们是如何以及为什么会走到今天这一步。

1.1 通向现代AI的道路

作为人类，我们总是试图找到方法来理解我们周围的世界，利用自然来实现我们的目标。为了做到这一点，我们总是依赖外部工具来增强我们大脑的能力。

算盘可能是第一个这样的工具，发明于大约5000到6000年前，用来帮助人们进行计算。虽然它仍然被用于帮助孩子们把简单的数学运算形象化，但它并没有真正地把我们从实际操作的劳动中解救出来。我们不得不等到20世纪60年代才有了第一台可以自动加减数字的机器。从那时起，计算机已经有了长足的进步，但它们的能力在本质上仍然非常简单：完全按照某些(专家)人类的指令执行计算。他们几乎没有“智慧”。

“人工”和“智能”两个词首次被放在一起是在1955年8月31日，当时达特茅斯大学的约翰·麦卡锡教授，与哈佛大学的M.L Minsky，来自IBM的罗切斯特，来自贝尔电话实验室的C. E. Shannon(香农)，请求洛克菲勒基金会资助一个人工智能研究峰会。他们的建议如下：

我们建议在1956年夏天在新罕布什尔州汉诺威的达特茅斯学院进行一项为期2个月、10人参与的人工智能研究……人们将尝试发现如何让机器使用语言，形成抽象和概念，解决目前人类面临的各种问题，并改进自己。我们认为，如果一组经过精心挑选的科学家在峰会共同研究这些问题，就可以在其中一个或多个问题上取得重大进展。

研究人员知道，由于技术限制和任务本身的复杂性，将智力作为一个整体来处理是一项非常艰巨的挑战。他们没有解决智力的广义概念，而是决定把注意力集中在像语言这样的子问题上。后来，这些应用被称为狭义人工智能。能够与人类能力匹敌或超越人类能力的人工智能将被称为广义人工智能。换句话说：

广义人工智能(或强人工智能)----一个人工智能程序能够处理它接收到的每一项任务。这类似于一个足智多谋的人类，你可以把它想象成终结者中的机器人(或者，希望是一个更和平的版本)。

狭义人工智能----一个人工智能程序，能够解决一个单一的，定义明确的任务。它可以是广泛的(从图片中识别物体)，也可以是非常具体的(预测购买了A产品的客户更有可能购买B产品)。这意味着一次只能执行一项任务，不能执行任何其他任务：识别图像中的猫的人工智能无法将英语翻译成意大利语，反之亦然。

广义人工智能离我们还很遥远：研究人员还不知道我们什么时候才能最终实现它。有些人认为我们永远也到不了那里。尽管人工智能仍然是一个遥远而模糊的梦想，但当人工智能在新闻中被提及时，许多人都会想到这一点。如果你是这些人中的一员，现在对广义AI还没到来感到失望，但请不要绝望。狭义人工智能应用仍然能够创造巨大的价值。例如，人工智能可以检测肺癌是一个很狭义的应用，但仍然非常有用。

1956年达特茅斯峰会研究的结果非常有趣，在参与者中激起了兴奋和希望的浪潮。科学家们的热情传到了美国政府，美国政府开始大量资助一项具体应用的研究:英语/俄语翻译。在冷战期间，找到值得信赖的俄罗斯翻译一定不是件容易的事。

经过最初几年的工作，一个政府委员会产生了1966年自动语言处理咨询委员会(ALPAC)报告。这份文件表达了许多研究人员对人工智能研究现状的看法。大多数都不是很积极:

早期机器翻译的简单或选定的文本…就像一般科学文献的“机器翻译”一样令人鼓舞，却同样令人沮丧……当然，没有人能保证我们不会突然或至少很快地实现机器翻译，但我们认为这是非常不可能的……没有立即或可预测的有用的机器翻译前景。

该报告标志着一个被称为“第一个人工智能冬天”的时期的开始：对人工智能研究的公共资助停止了，兴奋感冷却了，研究人员把他们的工作集中在了其他领域。

直到上世纪80年代，人们对人工智能的兴趣才有所复燃，当时IBM和施乐(Xerox)等私营企业开始投资一种新的人工智能春天(AI Spring)。一种被称为“专家系统”的技术为人们带来了新的希望：将某一领域的人类专家的知识以精确的“if-then”规则的形式编码的一种计算机程序。一个示例将帮助您理解专家系统是如何工作的。

假设你想建立一个人工智能系统来代替胃肠病学家。这就是专家系统的运作方式：你让医生极其精确地描述他们是如何对病人做出决定的。然后，您要求程序员不辞辛劳地将医生的知识和诊断流程转换为计算机可以理解和执行的if-then规则。一个极度简化的版本应该是这样的:

如果病人胃痛，体温高，那就是患了流感。

如果病人胃痛，并且吃了过期的食物，那就是食物中毒。

等等。一旦医生的知识被编码到软件中，病人进来了，软件就会遵循与医生相同的决策路径，(希望如此)得出相同的诊断结果。这种方法有几个问题:

较差的适应性——软件改进的唯一方法是与计算机科学家和专家(在本例中是医生)一起从头开始。

极端脆弱性----有些情况不是系统设计的一部分，就会出错。如果病人胃痛但体温正常，而且没有吃变质的食物怎么办?

很难维护——这样一个系统的复杂性是巨大的。当把成千上万的规则放在一起，改进或改变它是非常复杂、缓慢和昂贵的。你是否曾经用过一张巨大的Excel表格，却很难找出一个错误的原因？想象一个比它大100倍的Excel表格。

专家系统在商业上失败了。到上世纪80年代末，许多开发人工智能的公司倒闭，标志着第二个人工智能冬天的开始。直到21世纪初，新一代人工智能的成功出现了，这得益于一种古老的理念：机器学习。

1.2 人工智能革命的引擎：机器学习

机器学习的第一个定义可以追溯到1959年，来自美国人工智能先驱阿瑟·塞缪尔(Arthur Samuel)：

机器学习是一个研究领域，它使计算机能够在不需要明确编程的情况下学习。

这里的关键是学习和 不需要明确的编程。让我们首先关注后者。显式编程意味着定义执行特定任务时必须遵循的规则和指令。这是软件工程师在编写处理日常事务(如处理税务或填写电子表格)的软件时所做的工作。

没有编程经验的人常常觉得软件工程师是一种强大的生物，可以让机器屈服于他们的意志。不幸的是，事情并不总是那么容易。当你在做一些琐碎的事情时，试着想想你所做的各种决定：你能解释一下当你看到你的朋友时你是如何认出他们的吗？你开车时的瞬间决定是如何做出的？你能把你说话时用到的所有英语语法规则都列出来吗？如果你不能准确地解释你是如何做某事的，你就无法指导电脑去做。

塞缪尔建议用“赋予计算机学习的能力”来代替“指示计算机”。如果仔细想想，就会发现，学习而不是听从指令是人类一直在做的事情。我们的父母不会在我们一岁的时候给我们语法书来教我们母语。他们只是自然地和我们说话，我们从他们的例子中学习，在不知不觉中应用了成千上万的语法规则。事实上，我们的大脑在能够理性地理解学校语法之前，就已经能够自动地提取规则了！即使对我们人类来说，从例子中学习规则也比被告知要容易得多。

就像我们从经验中学习一样，机器学习(ML)技术允许计算机从数据中学习。让我们用一个经典的小例子来具体说明一下：教计算机识别图片中的猫狗。如果你不得不教一个孩子做这个任务，你不会拿起一本兽医的书，开始读关于耳朵形状或皮毛颜色的差异。相反，你可能只是让他们看几张图片，然后让他们的大脑发挥它的魔力。

“狗或猫”问题的ML解决方案类似于我们的童年学习经验。我们给电脑输入成千上万张猫的图片，告诉它“这些是猫”，然后再输入成千上万张狗的图片，告诉它“这些是狗”。“最后，我们让它自动找出两个宠物之间的区别。我们不需要解释区分狗和猫的关键因素。一个好的ML应用程序应该从它收到的示例中了解这一点。图1.1显示了传统编程和机器学习之间的区别。

你可能会开始明白为什么ML在2000年之前不可能蓬勃发展。这项技术的主要组成部分是数据，而internet使收集数据变得更加容易。ML的另一个关键因素是计算能力：从数据中学习并不是免费的，计算机需要高速处理器来完成这项任务。由于云计算和处理能力的提高，访问强大的计算机从来没有这么容易和便宜。

为了让你了解在短短几年内发生了多大的变化，我们采访了Alex Waibel，他是语音识别领域人工智能的先驱之一，也是Facebook人工智能团队的首批成员之一：20年前在ML方面的工作有多大的不同。21世纪初，他能使用的最强大的电脑有一间公寓那么大，造价几百万美元，他需要租电脑来训练他的模型。如今，只要花几千美元，他就可以在办公桌上拥有更强大的计算能力。你的手机可能比顶尖研究人员20年前使用的手机更强大。

数据的可用性和廉价的计算能力为机器学习的发展创造了完美的环境。事实上，许多(大多数)最酷的面向消费者的应用程序，也就是我们今天所说的人工智能，都严重依赖于ML：Siri语音虚拟助手，谷歌翻译，自动驾驶汽车，等等。

回顾人工智能的历史，ML似乎是今天人工智能爆发的引擎，在上世纪80年代人工智能的最后一个冬天后，终于带来了一些希望。事实上，现代人工智能的成功是如此依赖于ML技术，以至于人们常常混淆两者之间的区别。那么，什么是人工智能呢？让我们找出答案。

1.3 到底什么是人工智能?

在我们作为技术专家、顾问和公众演讲者的经验中，我们经常遇到对AI、数据科学和ML的定义有不同意见的人。尽管许多人很固执己见，但很少有人能捍卫自己的立场。事实上，找到一个通用的人工智能定义并不像看上去那么简单。

根据它的名字，我们可以通过发现与智能相关的人类特征来定义人工智能。一旦我们就什么造就了人类的智能达成一致，我们就可以说，任何做同样事情的电脑都是人工智能。这是有道理的，对吧?尽管这是一种常见的方法，但即使在简单的场景中，它也会非常难于解释。例如，一个人可以在一秒钟内将13.856除以13得到10位小数，这肯定被称为智能，而它的人工替代物是一个2美元的袖珍计算器，没有人称它为人工智能。与此同时，我们永远不会仅仅因为一个人能在繁忙的交通中开车就称他为“智能”，然而无人驾驶汽车通常被认为是科技行业目前正在研发的最困难的人工智能形式之一。我们不应该惊讶于定义智能有多么困难：毕竟，哲学家和科学家已经就这个问题争论了几个世纪。

我们不仅有各种衡量人类和机器智能的权重，而且似乎也在迅速改变着对什么是人工智能、什么不是人工智能的看法。让我们以保罗·格雷厄姆(Paul Graham)为例，Y Combinator的创始人，Y Combinator是硅谷最成功的创业加速器，保罗·格雷厄姆可以说是科技界最有远见的人之一。2002年，Graham写了一篇文章，提出了一种检测垃圾邮件的新方法。当时，电子邮件刚刚起步，垃圾邮件(不想要的电子邮件)是非技术人员使用互联网的最严重威胁之一。现在似乎很难想象，但最优秀的计算机科学家正忙于编写复杂的规则，让计算机自动对伟哥广告进行分类。

在他的文章中，Graham想到了一种新的基于ML的方法，这种方法可以通过处理成千上万的“好”邮件和垃圾邮件来学会对邮件进行分类。Paul的简单软件学会了更好地识别垃圾邮件，而不是工程师们炮制出来的复杂规则。快进20年，自动垃圾邮件探测器是一项如此无聊的技术，如果我们敢称它为人工智能，我们会被笑出房间。

事实上，人工智能似乎是为了出处理我们想象中计算机不应该完成的任务。一旦我们在日常生活中习惯了一种技术，我们就会摘下人工智能的荣誉徽章，开始称它为计算机软件。这是一个被广泛研究的现象，叫做人工智能效应。

由于人工智能的影响，我们所说的人工智能的目标一直随着技术的进步而快速前进。我们从这些认识中得出的人工智能的定义是“一个做了一些很酷、很惊人的事情的软件，直到我们习惯它之前，它只是一个软件的临时标签”。不知道你会怎么想，但这并不是一个令人满意的定义。

我们希望我们已经让你相信，很难找到一个让每个人都满意的定义，而且随着技术的发展，这个定义依旧是有效的。考虑到人工智能的影响，我们决定避免对人工智能狭隘定义，即奖励那些“华而不实”的应用程序，只是为了在炒作结束后抛弃它们。我们采用更广泛的定义，包括不那么花哨的应用程序。这是我们对AI的定义:

没有明确的人工指令就能解决问题的软件。

如您所见，我们的定义侧重于技术的结果，而不是用于构建它的特定技术。有些人可能不同意，因为它几乎等同于我们在本章前面谈到的机器学习。事实是，学习是一种智能特性，尽管ML只是一个工具，但它是我们今天称之为人工智能的99%成功应用程序背后的工具。这在未来可能会改变，但是我们并没有看到任何新的方法可以像ML一样有同样的前景。这就是为什么我们在这本书中涉及的每一个AI应用都是基于ML：这是对今天和不久的将来人工智能前景最准确的描述。

现在，我们对ML是什么有了一个清晰的认识，对现代人工智能有了一个可行的定义，对这些术语是如何演变的也有了一些看法。我们刚刚错过了你可能听说过的第三个流行词：数据科学。

数据科学(DS)是一个广泛的、多学科的领域，它使用科学的方法和过程来分析数据和提取见解。ML技术是DS工具箱中的一些工具。实际上，当人们提到数据科学项目时，他们通常指的是一些静态的东西：从数据中提取见解，并以演示或报告的形式呈现出来。另一方面，人工智能在实时软件环境中更常用。

例如，分析交通数据，来为一个城市设计新城市规划，以最小化交通堵塞，这可能属于数据科学的范畴。然而，如果你使用相同的数据来实时控制交通，并引导汽车通过不那么拥挤的路线，大多数人会说这个项目是关于人工智能的。在第一种情况下，项目的输出是一个报告，而在第二种情况下，它是24/7运行的“实时”软件。请记住，这种划分是传统模式的划分的：关于什么是人工智能，什么是数据科学，真的没有硬性规定。表1.1总结了我们所看到的差异。

表1.1 人工智能与数据科学的主要区别

AIDS

根据数据自动执行任务或预测未来事件。通常是"实时"的：不断地分析新数据并给出答案。它通常有软件的形式。基于数据产生见解。通常是“一次性的”:它产生的一些见解为决策提供信息。它通常以陈述或报告的形式出现。

希望这部分有助于澄清一些经常被误解的术语，并为这些技术创建上下文。现在你可以开始学习人工智能的核心原则了，可以利用它做什么，以及如何将这种变革性的技术引入到组织中。在下一节中，我们将解释这段旅程的步骤，以及这本书是如何指导您完成这些步骤的。

1.4 我们的教学方法

如果你想在工作中有效地使用人工智能，首先要了解它的具体细节。我们注意到，非技术人员在接触人工智能时，如果没有对其原理有坚实的理解，往往会梦想着那些根本不可能完成的项目，或者错过那些容易实现的目标。在读完本书的第一部分之后，你将知道所有的AI原则，你需要避免这些死胡同，并充分利用这项技术。

甚至在第一章之后，你就已经知道几乎所有现代人工智能应用都依赖于机器学习，而机器学习就是从数据中学习。这就是为什么我们使用数据作为理解AI的指南。本书第一部分的每一章都聚焦于一种特定类型的数据，向你展示如何在你的组织中发现它，你可以用它做什么，以及它如何适应人工智能的世界。

第1部分的每一章都使用一个简单的示例来介绍ML概念。我们发现这是教授ML概念的最有效的方法，否则这些概念就太枯燥和抽象了。我们没有深入研究技术方面，原因很简单：

技术变化如此之快，以至于实现细节很快就会过时。

简单地说，你不需要它。除非你想把你的职业生涯转向写代码，否则我们相信，在你的知识财富中加入人工智能，让别人用电脑实现你的愿景，会有更大的价值。

这并不意味着我们会完全不讨论技术问题。从我们作为工程师的经验来看，我们知道如果没有一点技术上的理解，您的技术团队很难与人沟通。我们不希望他们与你交谈有困难，所以我们确保你将学习人工智能工具最重要的技术方面。了解它们会帮助您计划和管理这些工作。

每一章都包括一个或多个关于取得非凡业绩的公司的真实商业案例。当我们提到特定的公司、产品或服务时，请记住，我们这样做是因为我们想让你提高意识，但你不应该受限于他们。我们与案例研究中的任何公司均无关联或利害关系;碰巧的是，他们正在创造伟大的产品，我们都可以从中学习。

在展示案例时，我们采用了一种受哈佛商学院案例法启发的方法：我们将首先以最中立的方式介绍这个案例，并在最后问你一些开放式的问题。在那之后，阐明我们对这些问题的想法，并提示进一步的讨论。我们建议你不要马上阅读这些答案，而是试着根据你的知识和你在案例中读到的内容来思考如何回答，然后再阅读我们的观点。请注意，对于我们提出的问题，并没有唯一的解决方案：如果你发现一个有趣的案例，我们没有包括在答案中，那就太好了！这意味着你已经了解了你所需要的，并且能够自己提取见解(因此，如果发生了这种情况，我们在这本书中也达到了我们的目标)。

1.5 本章总结

人工智能的成功和失败的历史可以追溯到20世纪50年代。

广义AI是拥有全知机器的白日梦。我们今天所有的人工智能应用都是狭义的;他们专注于特定的任务。

机器学习是当今实现人工智能的流行方式，它的基础是让机器从数据中自主学习。

数据科学与人工智能和机器学习有关，但更侧重于提取见解，而不是持久的智能。