此前做过几次公益讲座,谈论到一些人工智能的历史发展,这里把主要内容整理成图文分享给大家,希望有所帮助。
整篇文章比较长,图也很多,可能需要10多分钟才能看完。
也可以点这里分节阅读
很高兴和大家一起分享关于人工智能的基础常识性内容,今天我们来聊聊人工智能的过去,从历史的角度看看人工智能的来龙去脉。
人工智能的诞生,我们要从能够计算的机器说起。
1000多年前的北宋时期,我国古代人民就发明算盘作为日常数学计算的工具,依靠人工手指拨动算珠进行加减乘除四则运算,算盘只是帮助人类记录和显示效果,不含有任何智能成分。
大约200年前,英国数学家巴贝奇设计了第一台能计算二次多项式的计算机器,叫做差分机,摇动图中左侧的手柄,就可以计算出x2+a这样式子的值。
由于时代限制,尽管巴贝奇消耗的资金足够制造好几艘军舰,但他最终也没完成差分机的制造。图上展示的是后来依照巴贝奇的设计图纸制造的。大家可以通过下面这个视频感受一下。
这个视频大概是在计算42+2,正确的话摇上十几秒钟就能得到18了。
虽然功能有限,但是这个机器第一次真正意义上减少了人类大脑的计算压力,只要提供手摇动力就能实现计算。机械从此开始具有计算智能。
真正奠定现代计算机理论基础的是库尔特.哥德尔,他正式提出可以把人类的全部认知归结为无数条定理,并且这些定理都可以用数学的模式进行表示和逻辑推导。
冯.诺依曼被称为现代计算机之父,。
他设计了经典的冯.诺依曼结构,就是将软件命令和数据素材都存在一起,整个设备由中央处理器,内存,硬盘,输入接口,输出设备组合而成,程序命令按照顺序执行,其次再考虑时间。
数十年一直到现在,我们的几乎所有计算机、笔记本、智能手机都是基于冯诺依曼结构制造和运行的。
图中展示的是1945年制造的ENIAC,世界上第一台通用电子计算机。由于命令仍然需要人工输入和调整,所以经常为了计算某个问题,需要专门人员拔掉或接入上千个插口,图中两位淑女就是在做这个工作。1947年冯诺依曼率领团队在此设备的基础上进行改造和升级,设计制造了真正意义上的现代电子计算机设备MANIAC。
机器会思考吗?阿兰.图灵在1950年发表的论文《计算机器与智能》中第一行就提到这个问题。图灵被称为计算机科学之父,也是人工智能科学之父。二战期间,他的团队在1943年研制成功了被叫做“巨人”的机器,用于破解德军的密码电报,这一贡献让二战提前2年结束,挽救了数千万人的生命。
图灵富有传奇的一生带有很浓的悲剧色彩,他是世界上最知名的同性恋认识之一,其影响力甚至超过当今苹果公司的CEO库克。在当时时代这是不被社会所接受的,尽管图灵为军方做出了巨大贡献,但最终还是被英国政府迫害而死,年仅42岁,当人们发现图灵自杀死去的时候,他的桌上留有一个沾满氰化钾的毒苹果。
为了纪念图灵,1966年美国计算机协会设立了图灵奖,这是当今计算机领域全世界最富盛名,最崇高的奖项。
很多人认为乔布斯当年设定的被咬了一口的苹果标志,就是纪念计算机科学先驱,艾伦.图灵。
艾伦图灵对后世最大的理论贡献之一就是图灵机。如图中所示,盒子在带有符号的轨道上行进,读取轨道当前符号,然后根据盒子里面的程序对当前符号和盒子里的数字进行计算,得到新的数字并记录到盒子里,然后盒子就会根据这个数字前进或者后退,到达新的轨道位置后再次读取轨道上的符号进行计算,以此类推。
粗糙的说,和我们平时玩的大富翁游戏差不多,区别在于大富翁游戏每次前进或者后退的判断是我们人类根据纸上的规则判断的,而图灵机的盒子可以自己进行判断,就仿佛具有智能的生物一样,可以自己不停的走下去,直到轨道上某个符号代表停止。
图灵机至今仍然是计算机软件程序的最基本架构,也是机器智能的开端。
图灵的另一个伟大理论贡献是图灵测试,至今仍然被当做人工智能水平的重要测试标准之一。
图灵测试是指,人们通过设备和另外一个人进行聊天,可以是文字形式也可以是语音,这不重要。重要的是聊天之后,如果30%的人认为是在和一个真人聊天,而实际对方却是个机器,那么我们就认为这个机器通过了图灵测试,它是具有智能的。
以现在的计算机人工智能技术来说,30%的比例定的有些低,近年来很多人工智能对话程序都已经能够通过图灵测试。
上面介绍的内容可能有些枯燥,这里推荐三部电影大家可以去观看,第一本中文名叫做《隐藏人物》,展示了计算机技术被应用之前,美国宇航局如何利用大量人工计算来实现登月任务的。第二本是《模仿游戏》,由奇异博士主演,精彩演绎了艾伦图灵坎坷的一生。最后一本是法鲨主演的《乔布斯》,展现了苹果公司历史发展的精彩瞬间。
如果说人工智能诞生需要三个条件,一是计算机,二是图灵测试,那么第三就是达特茅斯会议。
1956年,一群科学家聚会在美国汉诺思小镇宁静的达特茅斯学院,他们试图利用暑假期间的两个月进行封闭式的讨论和研究,而这次会议的主题就是“达特茅斯夏季人工智能研究计划”。
这张图片是会议之后半个世纪2006年拍摄的当年主要参会者的合影,最左边的是特伦查德摩尔,数学家和计算机科学家,曾在IBM的沃森研究中心工作;
左数第二位是约翰麦卡锡,他是达特茅斯会议的发起人,1971年图灵奖得主,Lisp语言创始人。
中间的是马文闵斯基,知名的认知科学家,曾在1951年建立了第一个神经网络,模拟了40个神经元。
右数第二位是奥利弗赛弗里奇,被称为“机器感知之父”。
最右侧的是雷所罗门诺夫,经验概率理论的发明人。
虽然这个会议实际只进行了一个多月,也没产生什么具有影响力的研究成果,但是这个会议首次正式提出人工智能一词,Artificial Intelligence,AI,一直被沿用至今,所以此次会议也就被认为是人工智能正式诞生的元年了。
达特茅斯会议之后,人工智能研究进入了20年的黄金时代。
在美国,成立于1958年的国防高级研究计划署对人工智能领域进行了数百万的投资,让计算机科学家们自由的探索人工智能技术新领域。
这个阶段诞生了世界上第一个聊天程序ELIZA,它是由麻省理工学院的人工智能学院在1964到1966年期间编写的,能够根据设定的规则,根据用户的提问进行模式匹配,然后从预先编写好的答案库中选择合适的回答。
这也是第一个尝试通过图灵测试的软件程序,ELIZA曾模拟心理治疗医生和患者交谈,在首次使用的时候就骗过了很多人。
“对话就是模式匹配”,这是计算机自然语言对话技术的开端。
1959年,计算机游戏先驱亚瑟塞缪尔在IBM的首台商用计算机IBM 701上编写了西洋跳棋程序,这个程序顺利战胜了当时的西洋棋大师罗伯特尼赖。
西洋跳棋是个简单的游戏,棋子每次只能向斜对角方向移动,但如果斜对角有敌方棋子并且可以跳过去,那么就把敌方这个棋子吃掉。
塞缪尔的跳棋程序会对所有可能跳法进行搜索,并找到最佳方法。“推理就是搜索”,是这个时期主要研究方向之一。
在日本,早稻田大学1967年启动了WABOT项目,至1972年完成了第一代机器人产品WABOT-1,有双手双脚,有摄像头视觉和听觉装置。
虽然这个机器人能够搬东西也能移动双脚,但每走一步要45秒,而且只能走10厘米,相当的笨重缓慢。
在这个黄金时代里,约翰麦卡锡开发了LISP语音,成为以后几十年来人工智能领域最主要的编程语言;马文闵斯基对神经网络有了更深入的研究,也发现了简单神经网络的不足;多层神经网络、反向传播算法开始出现;专家系统也开始起步;第一台工业机器人走上了通用汽车的生产线;也出现了第一个能够自主动作的移动机器人。
经典科幻片《2001:太空漫游》也在1968年上映,宇宙飞船搭载的人工智能电脑HAL9000让所有观众印象深刻。
“三到八年内,我们将建造出和人一样智能的机器”,“十年内,计算机将成为国际象棋冠军”,“二十年内,机器将可以做任何人类工作”,这个时代,科学家们甚至整个世界都对人工智能技术充满乐观的期望。
出生就遇到黄金时代的人工智能,过度高估了科学技术的发展速度,太过乐观的承诺无法按时兑现的时候,就引发了全世界对人工智能技术的怀疑。
1973年,著名数学拉特希尔家向英国政府提交了一份关于人工智能的研究报告,对当时的机器人技术、语言处理技术和图像识别技术进行了严厉的批评,尖锐的指出人工智能那些看上去宏伟的目标根本无法实现,研究已经完全失败。此后,科学界对人工智能进行了一轮深入的拷问,使AI的遭受到严厉的批评和对其实际价值的质疑。
随后,各国政府和机构也停止或减少了资金投入,人工智能在70年代陷入了第一次寒冬。
这次寒冬不是偶然的。在人工智能的黄金时代,虽然创造了各种软件程序或硬件机器人,但它们看起来都只是“玩具”,要迈进到实用的工业产品,科学家们确实一些遇到了不可战胜的挑战。
让科学家们最头痛的就是虽然很多难题理论上可以解决,看上去只是少量的规则和几个很少的棋子,但带来的计算量增加却是惊人的增长,实际上根本无法解决。就像26个字母魔法般的组合成数万个单词,进而在不同语境下组合成无限种句子。比如运行某个有2的100次方个计算的程序,即使用现在很快的计算机也要计算数万亿年,这是不可想象的。
就像飞机需要有足够的马力才能从跑道上起飞,人工智能也需要足够的计算力才能真正发挥作用。当时有科学家计算得出,要用计算机模拟人类视网膜视觉至少需要执行10亿次指令,而1976年世界最快的计算机Cray-1造价数百万美元,但速度还不到1亿次,普通电脑的计算速度还不到一百万次。
五十年后,现在我们的笔记本或者手机能够依赖摄像头轻松实现人脸识别,这些设备的运算速度其实都已经超过百亿次,当然没有压力。
人工智能还需要大量的人类经验和真实世界的数据,要知道即使一个三岁婴儿的智能水平,也是观看过数亿张图像之后才形成的。由于当时计算机和互联网都没有普及,或者如此庞大数据是不可能的任务。
很多人工智能科学家开始发现,数学推理、代数几何这样的人类智能,计算机可以用很少的计算力轻松完成,而对于图像识别、声音识别和自由运动这样人类无须动脑,靠本能和直觉就能完成的事情,计算机却需要巨大的运算量才可能实现。
这个论调一方面让人怀疑早期神经网络算法的有效性和实用性,另一方面也导致人工智能技术向更加功利化、实用化方向发展,不再像黄金时代那样充满想象,充满对模拟通用人类智能的追求。
曾经一度被非常看好的神经网络技术,过分依赖于计算力和经验数据量,因此长时期没有取得实质性的进展,1969年马文敏斯基与人合著的《感知器》一书,这本书阐明了神经网络现阶段的真实能力,也表明之前很多过于乐观的预测是难以实现的理论。尽管书中内容科学客观,但也对神经网络技术产生了毁灭性的打击,后续十年内几乎没人投入更进一步的研究。
当然,十年河东十年河西,数十年后,神经网络又已经成我们现在人工智能的关键技术。
1979年,斯坦福大学制造了有史以来最早的无人驾驶车Stanford Cart,它依靠视觉感应器能够在没有人工干预的情况下,自主的穿过散乱扔着椅子的房间,虽然可能有点慢,需要几个小时才能完成。
专家系统在这个时代的末尾出现,并开启了下一个时代。
1978年,卡耐基梅隆大学开始开发一款能够帮助顾客自动选配计算机配件的软件程序XCON,并且在1980年真实投入工厂使用,这是个完善的专家系统,包含了设定好的超过2500条规则,在后续几年处理了超过80000条订单,准确度超过95%,每年节省超过2500万美元。
1980年卡耐基梅隆大学(CMU)研发的XCON正式投入使用,这成为一个新时期的里程碑,专家系统开始在特定领域发挥威力,也带动整个人工智能技术进入了一个繁荣阶段。
专家系统的起源可以追溯到黄金时代,1965年,在斯坦福大学,美国著名计算机学家费根鲍姆带领学生开发了第一个专家系统Dendral,这个系统可以根据化学仪器的读数自动鉴定化学成分。
费根鲍姆还是斯坦福大学认知实验室的创始人,70年代在这里还开发了另外一个用于血液病诊断的专家程序MYCIN(霉素),这可能是最早的医疗辅助系统软件。
专家系统其实就是一套计算机软件,它往往聚焦于单个专业领域,模拟人类专家回答问题或提供知识,帮助工作人员作出决策。它一方面需要人类专家整理和录入庞大的知识库(专家规则),另一方面需要计算机科学家编写程序,设定如何根据提问进行推理找到答案,也就是推理引擎。
专家系统把自己限定在一个小的范围,避免了通用人工智能的各种难题,它充分利用现有专家的知识经验,务实的解决人类特定工作领域需要的任务,它不是创造机器生命,而是制造更有用的活字典,好工具。
XCON取得的巨大商业成功,80年代三分之二的世界500强公司开始开发和部署各自领域的专家系统,据统计,在1980到1985这5年间,就有超过10亿美元投入到人工智能领域,大部分用于企业内的人工智能部门,也涌现出很多人工智能软硬件公司。
计算机技术和人工智能技术的快速发展,点燃了日本政府的热情。1982年,日本国际贸易工业部发起了第五代计算机系统研究计划,预计投入8.5亿美元,目的是抢占未来信息技术的先机,创造具有划时代意义的超级人工智能计算机。
日本尝试使用大规模多CUP并行计算来解决人工智能计算力问题,并希望打造面向更大的人类知识库的专家系统来实现更强的人工智能。图中展示的就是当时日本研发的具有512颗CPU并行计算能力的第五代计算机。
这个项目在十年后基本以失败结束,主要是当时低估了PC计算机发展的速度,尤其是intel的x86芯片架构在很快的几年内就发展到足以应付各个领域专家系统的需要。
然而,第五代计算机计划极大的推进了日本工业信息化进程,加速了日本工业的快速崛起;另一方面,这开创了并行计算的先河,至今我们使用的多核处理器和神经网络芯片,都受到了20多年前这个计划的启发。
当各个垂直领域的专家系统纷纷取得成功之后,尤其是日本试图抢占先机的第五代计算机计划的刺激,美国和很多欧洲国家也加入到这个赛道中来。
1982年美国数十家大公司联合成立微电子与计算机技术公司(MCC),该公司1984发起了人工智能历史上最大也是最有争议性的项目,Cyc,这个项目至今仍然在运作。
Cyc项目的目的是建造一个包含全人类全部知识的专家系统,“包含所有专家的专家”。截止2017年,它已经积累了超过150万个概念数据和超过2000万条常识规则,曾经在各个领域产生超过100个实际应用,它也被认为是当今最强人工智能IBM Woston的前身。
但随着科技的发展,21世纪到来之后,Cyc这种传统依赖人类专家手工整理知识和规则的技术,受到了网络搜索引擎技术、自然语言处理技术以及神经网络等新技术的挑战,未来发展并不明朗。
沉寂10年之后,神经网络又有了新的研究进展,尤其是1982年英国科学家霍普菲尔德几乎同时与杰弗里·辛顿发现了具有学习能力的神经网络算法,这使得神经网络一路发展,在后面的90年代开始商业化,被用于文字图像识别和语音识别。
图中是霍普菲尔德。
另一边,在德国的1986年,慕尼黑的联邦国防军大学把一辆梅赛德斯-奔驰面包车安装上了计算机和各种传感器,实现了自动控制方向盘、油门和刹车。这是真正意义上的第一辆自动驾驶汽车,叫做VaMoRs,开起来时速超过80公里。
图中看起来这辆车很笨重,这是由于当时硬件发展限制,整个车的后半部分都是用来安装计算机设备的,摄像头在前玻璃后视镜位置附近。
在1970年代,人工智能技术的发展,对硬件计算和存储都有着越来越高的要求。而在当时,全世界的计算机硬件结构和软件系统都没有统一的标准,各国政府和大企业都希望占领先机掌握标准制定权。
人工智能领域当时主要使用约翰麦卡锡的LISP编程语言,所以为了提高各种人工智能程序的运输效率,很过研究机构或公司都开始研发制造专门用来运行LISP程序的计算机芯片和存储设备,打造人工智能专用的LISP机器。
这些机器可以比传统计算机更加高效的运行专家系统或者其他人工智能程序,上面专家系统配图展示的就是一台商用LISP机器。
虽然LISP机器逐渐取得进展,但同时80年代也正是个人电脑崛起的时间,IBM PC和苹果电脑快速占领整个计算机市场,它们的CPU频率和速度稳步提升,越来越快,甚至变得比昂贵的LISP机器更强大。
直到1987年,专用LISP机器硬件销售市场严重崩溃,人工智能领域再一次进入寒冬。
专家系统最初取得的成功是有限的,它无法自我学习并更新知识库和算法,维护起来越来越麻烦,成本越来越高。以至于很多企业后来都放弃陈旧的专家系统或者升级到新的信息处理方式。
80年代末,包括日本第五的计算机计划在内的很多超前概念都注定失败,原本科幻美好的人工智能产品承诺都无法真正兑现。
人们开始对于专家系统和人工智能的信任都产生了危机,一股强烈的声音开始对当前人工智能发展方向提出质疑,他们认为使用人类设定的规则进行编程,这种自上而下的方法是错误的。大象不玩象棋,但大象可以从现实中学会识别环境并作出判断,人工智能技术也应该拥有身体感知能力,从下而上才能实现真正的智能。这种观点是超前的,但也推动了后续神经网络技术的壮大和发展。
硬件市场的溃败和理论研究的迷茫,加上各国政府和机构纷纷停止向人工智能研究领域投入资金,导致了数年的低谷,但另一方面也取得了一些重要成就。
1988年,美国科学家朱迪亚·皮尔将概率统计方法引入人工智能的推理过程中,这对后来人工智能的发展起到了重大影响。
IBM的沃森研究中心把概率统计方法引入到人工智能的语言处理中,Candide项目基于200多万条语句实现了英语和法语之间的自动翻译。同年,英国人工智能科学家卡朋特开发了Jabberwacky聊天程序,尝试更好的通过图灵测试,至今这个程序的后续版cleverbot仍然很多人在使用。
1992年,当时在苹果公司任职的华人李开复,他使用统计学的方法,设计开发了具有连续语音识别能力的助理程序,Casper,这也是二十年后Siri最早的原型。Casper可以实时识别语音命令并执行计算机办公操作,类似于语音控制做word文档。
1989年,AT&T贝尔实验室的雅恩·乐昆和团队使用卷积神经网络技术,实现了人工智能识别手写的邮政编码数字图像。
1993年,美国科幻小说作家弗诺·芬奇发布了《即将到来的奇点》一文,三十年内我们将发明超越人类的智能,人类社会将被终结。
弗诺·芬奇的奇点理论只会让人感到不安。经历过半个世纪风雨起伏的人工智能行业,终于学会了低调行事。
在此后的近二十年,一方面人工智能技术逐渐与计算机和软件技术深入融合,为了让自己的工作内容听起来更切实而不科幻,很多研究者都不再使用人工智能这个术语,而是叫做诸如数据分析、商业智能、信息化、知识系统、计算智能等词汇,研究成果或开发的功能往往也直接成为软件工程的一部分。
另一方面,在这个阶段,人工智能算法理论的进展并不多,很多研究者都只是基于以前时代的理论,依赖于更强大更快速的计算机硬件就可以取得突破性的成果。
1995年,理查德华莱士收到60年代聊天程序ELIZA的启发,开发了新的聊天机器人程序Alice,它能够利用互联网不断增加自身的数据集,优化内容。
虽然Alice也并不能真的通过图灵测试,但它的设计思想影响深远,2013年奥斯卡获奖影片《her(她)》就是以Alice为原型创作的。
90年代最具轰动的莫过于1997年,IMB的计算机深蓝Deep blue战胜了人类世界象棋冠军卡斯帕罗夫。
实际上,在1996年,深蓝就曾经与卡斯帕罗夫对战,但并没有取胜,还受到卡斯帕罗夫的嘲笑,它认为计算机下棋缺乏悟性,永远不会战胜人类。
1996年失败之后,IBM对深蓝进行了升级,它拥有480块专用的CPU,运算速度翻倍,每秒可以预测2亿次,可以预测未来八步或更多的棋局。这种情况下人类冠军只能惜败。
战后,卡斯帕罗夫表示深蓝有时可以“像上帝一样思考”。虽然这次世纪之战只是计算机依赖速度和蛮力,在规则明确、条件透明的游戏中才能取得的胜利。
1997年,两位德国科学霍克赖特和施米德赫伯 提出了长期短期记忆(LSTM) 这是一种今天仍用于手写识别和语音识别的递归神经网络,对后来人工智能的研究有着深远影响。
1998年,美国公司创造了第一个宠物机器人Furby。
而热衷于机器人技术的日本,2000年,本田公司发布了机器人产品ASIMO,经过十多年的升级改进,目前已经是全世界最先进的机器人之一。
2001年,由斯皮尔伯格导演的电影《AI》上映,影片描述了未来人与机器人共生世界的种种悖论,人工智能一度引发社会关注,但关于技术的主题很快就被淡忘,数年后的观众只记得关于人性、关于爱与被爱的悲情故事。
家用机器人一直是人们关注的重点,1996年美国公司伊莱克斯推出了第一款机吸尘器机器人,也就是现在大家在使用的扫地机器人,但由于产品缺陷很多很快以失败告终。
2002年,美国先进的机器人技术公司iRobot面向市场推出了Roomba扫地机器人,大获成功。iRobot至今仍然是扫地机器最好品牌之一。
2004年,美国神经科学家杰夫·霍金斯出版了《人工智能的未来》一书,深入讨论了全新的大脑记忆预测理论,指出了依照此理论如何去建造真正的智能机器,这本书对后来神经科学的深入研究产生了深刻的影响。
2006年,杰弗里辛顿出版了《Learning Multiple Layers of Representation》奠定了后来神经网络的全新的架构,至今仍然是人工智能深度学习的核心技术。
2007年,在斯坦福任教的华裔科学家李飞飞,发起创建了ImageNet项目。
为了向人工智能研究机构提供足够数量可靠地图像资料,ImageNet号召民众上传图像并标注图像内容。
ImageNet目前已经包含了1400万张图片数据,超过2万个类别。
自2010年开始,ImageNet每年举行大规模视觉识别挑战赛,全球开发者和研究机构都会参与贡献最好的人工智能图像识别算法进行评比。尤其是2012年由多伦多大学在挑战赛上设计的深度卷积神经网络算法,被业内认为是深度学习革命的开始。
华裔科学家吴恩达及其团队在2009年开始研究使用图形处理器(GPU而不是CPU)进行大规模无监督式机器学习工作,尝试让人工智能程序完全自主的识别图形中的内容。
2012年,吴恩达取得了惊人的成就,向世人展示了一个超强的神经网络,它能够在自主观看数千万张图片之后,识别那些包含有小猫的图像内容。这是历史上在没有人工干预下,机器自主强化学习的里程碑式事件。
在人工智能技术的发展历史上,美国军方的身影一致若隐若现,曾经在寒冬期放弃人工智能战略的DARPA,早已再次加入行业战场。
2004年开始,DARPA连续组织了多场自动驾驶汽车技术挑战赛,试图探索利用人工智能实现更强的军事自动化,而到2012年后,DARPA挑战赛又转向机器人领域,希望在未来通过机器人技术提高作战效率。
2009年,谷歌开始秘密测试无人驾驶汽车技术;至2014年,谷歌就成为第一个在通过美国州自驾车测试的公司。
2011年,又是IBM,这次是人类的常识智力问答,在综艺竞答类节目《危险边缘》中,IBM的沃森系统与真人一起抢答竞猜,虽然沃森的语言理解能力也闹出了一些小笑话,但凭借其强大的知识库仍然最后战胜了两位人类冠军而获胜。
世纪之交的二十年中,人工智能技术与计算机软件技术深度整合,也渗透到几乎所有的产业中去发挥作用,同时,人工智能技术也越来越注重数学,注重科学,逐步走向成熟。
在21世纪第一个十年之前,对于简单的人类感知和本能,人工智能技术一直处于落后或追赶,而到2011年,在图像识别领域或常识问答比赛上,人工智能都开始表现出超过人类的水平,新的十年将会是人工智能在各个专业领域取得突破的时代。
2008以后,随着移动互联网技术、云计算技术的爆发,积累了历史上超乎想象的数据量,这为人工智能的后续发展提供了足够的素材和动力。
AI人工智能,Big data大数据,Cloud云计算,以及正在深入展开的IoT物联网技术,共同构成了21世纪第二个十年的技术主旋律。
2014年,伊恩·古德费罗提出GANs生成对抗网络算法,这是一种用于无监督学习的人工智能算法,这种算法由生成网络和评估网络构成,以左右互搏的方式提升最终效果,这种方法很快被人工智能很多技术领域采用。
2016年和2017年,谷歌发起了两场轰动世界的围棋人机之战,其人工智能程序AlphaGo连续战胜曾经的围棋世界冠军韩国李世石,以及现任的围棋世界冠军中国的柯洁。
曾经的宿敌,人类顶级围棋智慧的代表,如今已纷纷败在计算机高速的计算能力和优秀的人工智能算法之下。
“AlphaGo对我来说,是上帝般的存在。”柯洁赛后如此评价,“对于AlphaGo的自我进步速度来说,人类的存在很多余。”
AlphaGo背后是谷歌收购不久的英国公司Deep Mind,专注于人工智能和深度学习技术,目前该公司的技术不仅用于围棋比赛,更主要用于谷歌的搜索引擎、广告算法以及视频、邮箱等产品。人工智能技术已经成为谷歌的重要支撑技术之一。
谷歌2013年还曾收购了世界顶级机器人技术公司,波士顿动力学公司,2017年又出售给日本软银公司。
波士顿动力学崛起于美国国防部的DARPA大赛,其生产的双足机器人和四足机器狗具有超强的环境适应能力和未知情况下的行动能力。
图像识别技术正逐渐从成熟走向深入。从日常的人脸识别到照片中的各种对象识别,从手机的人脸解锁到AR空间成像技术,以及图片、视频的语义提取等等,机器视觉还有很长的路要走,也还有巨大的潜力等待挖掘。
2010年亚马逊公司就开始研发语音控制的智能音箱,2014年正式发布了产品Echo,这是一款可以通过语音控制家庭电器和提供资讯信息的音箱产品。
随后谷歌、苹果都推出类似产品,国内厂商如阿里、小米、百度、腾讯等也都纷纷效仿,一时间智能音箱产品遍地开花,都试图抢占用户家庭客厅的入口。
智能音箱的背后技术是语音助手,而目前最强技术都掌握在微软、谷歌、亚马逊、苹果和三星等几个巨头手中。
目前来看,常规语音识别技术已经比较成熟,发音技术有待完善。而真正的语义理解技术还都处于比较初级的阶段,对于松散自由的口语表述,语音助手往往无法获得重点,更无法正确回答。
2018年,谷歌发布了语音助手的升级版演示,展示了语音助手自动电话呼叫并完成主人任务的场景。其中包含了多轮对话、语音全双工等新技术,这可能预示着新一轮自然语言处理和语义理解技术的到来。
人工智能经历了半个多世纪的发展历程,涌现出了众多影响深远的技术、学者、公司和产品。
我们参照维基百科,把整个人工智能的历史分为七个时期。
1956年达特茅斯会议之前,第二次世界大战促科学技术的快速发展,图灵、哥德尔、冯诺依曼、克劳德香农等伟大的先驱者奠定了人工智能和计算机技术的基础。
达特茅斯会议之后,人工智能相关研究进入了野蛮生长的黄金时代。一方面,马文闵斯基建立了沿用至今的神经网络的基本算法结构;约翰麦卡锡发布了主导人工智能研究几十年的LISP语言;亚瑟塞缪尔开发了第一个可以战胜人类的西洋跳棋程序;这些对后世都产生了关键性影响。另一方面,麻省理工开发了世界第一个聊天机器人ELIZA,还出现了第一个自主运动的机器人shakey,他们试图制造具有通用智能和移动能力的产品,这些疯狂的想法也推高了整个社会对AI的期望和幻想。
十多年过去之后,当人们发现人工智能曾经的那些美好承诺都没能兑现,或者实际产品和预期相差太多的时候,就会产生质疑甚至愤怒。1973年莱特希尔报告成为了导火索事件,人们开始认为人工智能技术只是科学家和科幻小说家们描绘的海市蜃楼,并不会产生实际的作用。社会舆论的否定和支持资金的撤离,让人工智能行业陷入第一个寒冬。
寒冬并没有让所有研究者止步,只是更努力的寻找如何让人工智能创造实用价值的方法。70年代末80年代初,专注小范围知识领域的专家系统开始崛起并创造了巨大价值,这引发了工业自动化信息化技术革命。日本发起了第五代计算机计划,其他国家也纷纷加入这场竞赛,资金和资源再一次涌入人工智能领域,80年代再次成为繁荣发展时期。
但好景不长。人工智能领域的疯狂投入让这个行业产生了冒进,尤其是人工智能专用硬件LISP机器的发展显得混乱且缓慢。计算机领域不进则退,IBM、苹果在这个时机发起了个人计算机革命,笨重的LISP机器在短短几年内就被完全击溃。整个行业似乎都被将被颠覆,这是一个沉痛又短暂的寒冬期。
通用计算机设备的胜利,让传统的人工智能程序技术逐渐被埋葬,但也让人工智能真正开始和现代计算机技术进行深入融合。在世纪相交的二十年内,人工智能技术似乎沉睡隐身了,除了1997年IMB炒作的国际象棋人机大战之外,几乎很少听到AI的声音。然而这也正是人工智能韬光养晦低调发展的时代,它利用计算机和互联网的发展机遇,变身商业智能、数据分析、信息化、自动化、知识工程等名称,渗透到社会生产和生活的每个角落。
计算机和互联网一方面为人工智能提供了创造商业价值的载体,让AI技术研究可以稳步推进,另一方面也为人工智能的爆发积累了强大的运算力和经验数据。芯片技术、数据库技术以及神经网络算法的不断发展,让人工智能在越来越多赛事上创造奇迹,甚至超越人类。2011年沃森在自然语言常识问答比赛中战胜人类选手,DARPA挑战赛无人驾驶汽车时速可以达到80公里以上,ImageNet挑战赛上图像识别算法准确度超越人类,同年吴恩达创造了具有完全自学习能力可以识别猫的神经网络模型...
21世纪第二个十年,随着移动互联、大数据、云计算、物联网技术的迸发,人工智能技术也迈入了新的融合时代,从AlphaGo战胜李世石,到微软语音识别技术超越人类,到谷歌自动驾驶、波士顿动力学机器人,到满布市场的智能音箱,到每个人手机中的神经网络芯片和智能程序,人工智能从无形发展到有形的陪伴每个人的生产生活,半个多世纪前科学家曾经描绘的美好图景正在一步一步被人工智能技术所实现。
未来已来,AI已在。
附注:
整篇文章是参照维基百科进行整理和编写的。
这是一个很简要的历史提纲,可能忽略了很多重要的历史性事件。如果你发觉我有遗漏,欢迎留言,一起帮我把这个文章补全。
这个文章是简单的按照时间顺序组织的,其实人工智能整个历史有几条不同的线索,比如通用智能发展线索、神经网络发展线索、机器人技术发展线索、人工智能社会哲学与伦理发展线索等等,我相信如果能够有机会对每个线索进行分开研究一定能得到很多新的结论。
由于参考的文章来源太多,很多已经记不得出处了,下面是几个最主要的参考资料来源:
History of artificial intelligence
Gil Press:A Very Short History Of Artificial Intelligence (AI)
AI: 15 key moments in the story of artificial intelligence
人工智能通识文章索引
每个人的智能决策新时代
如果您发现文章错误,请不吝留言指正;
如果您觉得有用,请点喜欢;
如果您觉得很有用,欢迎转载~
END