机器学习(machine learning, 涵盖深度学习的一个人工智能技术领域)是一项改变历史的技术。
人工智能领域分化为两个阵营:其一是规则式(rule-based)方法,其二是神经网络(neural network)方法。
1. 规则式的人工智能系统有时也称为符号式系统(symbolic systems)或专家系统。是由于该阵营的研究人员认为,要使人工智能软件更好地适应现实世界,必须将相关领域的人类专家的智慧编写进软件。他们用一系列写好的逻辑规则来教导计算机如何思考,如“若X,则Y”。这种方法很适用于简单且定义明确的游戏,但是当可能的选择或操作数目大增时,这种方法就行不通了。
2. “神经网络”阵营则另辟蹊径,他们不把人脑熟稔的逻辑规则传授给计算机,而是干脆在机器上重建人脑。科学研究结果已经得知,动物的智能只有一个源头--动物脑部错综复杂的神经元网络,于是这个阵营的研究人员决定从根源做起,模仿人脑结构,构建类似生物神经元网络的结构来收发信息。不同于规则式方法,人工神经元网络的建造者通常不会给人工智能系统设定决策规则,而只是把某一现象(图片、国际象棋赛、人声等)的大量例子输入人工神经元网络,让网络从这些数据中学习、识别规律。换言之,神经网络的原则是来自人的干预越少越好。
用以上两种方法处理某个简单问题如“辨识一张图片里是否有猫”,就可以看出他们的差别。规则式方法确定以“若X,则Y”的逻辑规则来帮助程序做出决策:“若一个圆形物体上方有两块三角形,那么,这张图片中可能有一只猫。”
神经网络方法则是把数百万张标示了“有猫”或“没有猫”的样本图片“喂”给计算机系统,让他自行从这数百万张图片中去辨察哪些特征和“猫”的标签最密切相关。
神经网络从50年代开始至90年代末,一直处于冗长的寒冬期,使得神经网络复活,并让人工智能再次复兴的,是神经网络系统赖以生存的两项要素出现的变化,加上一项重大的技术型突破。神经网络需要大量的计算机运算力及数据:大量的数据样本数据输入系统,以“训练”程序去辨识形态,计算机运算力则让程序得以告诉分析样本数据。互联网的崛起带来了海量的数据:文本、图像、视频和点击、购买的数据等。如此多的数据,成了研究人员手中源源不断的实验材料,用来训练他们构建的人工神经网络。同时,计算机技术的不断发展,使得他们的算力越来越强,例如,我们现在手中的智能手机的运算力,甚至比美国国家航天局1969年登月计划中最先进计算机的运算力还高出几百万倍。这两项变化结合起来,为神经网络法的发展提供了优良的条件。
不过,彼时人工神经网络能做的事情仍然非常有限。复杂问题如果要得出准确的解雇,必须构建很多层的人工神经元,但是神经元层数增加后,研究人员当时还未找到针对新增神经元有效的训练方法。直到21世纪头10年的中期,深度学习这项重大技术的突破来了。找到了有效训练人工神经网络中新增神经元层的方法。性能大增的人工神经网络--现在有了新的名字:“深度学习(deep learning)”。正是这项技术的突破,人工智能才再次会到聚光灯下。
以深度学习的形式在次回到公众视野中的神经网络法不仅成功地让人工智能回暖,也第一次把人工智能真正的应用在现实世界中。研究人员、未来学家、科技公司CEO都开始讨论人工智能的巨大潜力:识别人类语言、翻译文件、识别图像、预测消费者行为、辨别欺诈行为、批准贷款、开车等。