我读该书最大的收获:
- 什么是深度学习
- 本次人工智能热潮跟以往的区别
- 哪些领域能最先使用AI技术取得成果 ?
- 投资人是怎么看眼前的AI创业机会的 ?
什么是深度学习?李开复举得例子很通俗易懂、很形象
第一章 人工智能来了
第二章 AI复兴:深度学习+大数据=人工智能
这一次人工智能复兴的最大特点是,AI在语音识别、机器视觉、数据挖掘等多个领域走进了业界的真实应用场景,与商业模式的紧密结合,开始在产业界发挥出真正的价值。
第三次AI热潮:有何不同?
1 三次人工智能浪潮:
- 20世纪50~60年代:以艾伦.图灵提出图灵测试为标志,数学证明系统、知识推理系统、专家系统等里程碑式的技术和应用为代表。
- 20世纪80~90年代:基于统计模型的技术悄然兴起,在语音识别、机器翻译等领域取得不俗的进展,以李开复的非特定人/连续语音识别技术为代表。
- 2010年前后,随着深度学习技术的成熟和兴起,加上计算机运算能力的提升和海量数据的积累,人工智能开启了第三次浪潮。
2 第三次人工浪潮的特点:
- AI在相关领域表现出可以被普通人认可的性能或效率,并因此被成熟的商业模式接受,开始在产业界发挥出真正的价值。
- 人工智能可以解决实际问题了:在机器视觉、语音识别、数据挖掘、自动驾驶等应用场景,人工智能达到了人们的预期,研究成果可以落地并发挥出价值。
- 跟以前两次热潮的驱动力不同:
- 学术研究为主导 vs 商业需求为主导
- 市场宣传层面 vs 商业模式层面
- 学术界游说政府和投资人 vs 投资人主动向研究机构投钱
图灵测试与第一次AI热潮
语音识别与第二次AI热潮
语音识别领域的三次跨越:
- 基于专家系统
- 基于统计模型
- 基于深度学习:识别正确率高达98%
深度学习携手大数据引领第三次AI热潮
人工神经网络:深度学习的核心计算模型
-
深度学习(书上的例子通俗易懂,很形象)
用人类的数学知识和算法构建起整体架构
在结合尽可能多的训练数据和大规模计算能力去调节内部参数
达到尽可能逼近目标的目的
-
特点
- 半理论、半经验的建模方式
- 基于实用主义思想
- 内部黑盒
-
大数据:人工智能的基石
- 三大基础
- 信息交换:通信和网络宽带的大幅增张
- 信息处理:整理、转换、分析数据的能力大幅增长
- 信息存储:计算机存储量的大幅增长
- 三大基础
-
人工智能三巨头
- 杰弗里·辛顿
- 把反向传播(Backpropagation)用于多层神经网络,发明玻尔兹曼机(Boltzman machine),这些直接导致了深度学习的实用化
- 多伦多大学、谷歌大脑
- 约书亚·本吉奥
- 在自然语言处理方向建树颇多,推动语音识别、机器翻译的发展
- 杨·勒丘恩
- 卷及神经网络(CNN):最有效的深度学习算法,应用于手写识别和OCR
- 杰弗里·辛顿
第三章 人机大战:AI真的会挑战人类?
第四章 AI时代:人类将如何变革?
第五章 机遇来临:AI先行的创新与创业
1 大时代,大格局
2 AI创业是时代的最强音
人工智能的商业化路线图
创新工场管理合伙人、资深投资人汪华认为,人工智能的商业化分为三个主要阶段:
第一阶段
AI会率先在那些在线化程度高的行业开始应用,在数据端、媒体端实现自动化。
这一过程会首先从线上“虚拟世界”开始,随着在线化的发展扩张到各个行业,帮助线上业务实现流程自动化、数据自动化和业务自动化。
拥有高质量线上大数据的行业会最早进入人工智能时代。
互联网和移动互联网的发展已经在许多领域为AI做好了业务流程和数据上的准备。例如:大家常说的金融行业是目前人工智能应用的热点,这正是因为金融行业特别是互联网金融已经做好了使用AI的准备。此外,美团等公司将餐饮服务与线上业务连接了起来,滴滴、摩拜单车等公司将交通出行与线上业务连接了起来。在这些拥有线上业务流程和高质量数据积累的地方,AI同样开始发挥作用,大幅提高线上业务的自动化程度。
第二阶段
随着感知技术、传感器和机器人技术的发展,AI会延伸到实体世界,并率先在专业领域、行业应用、生产力端实现线下业务的自动化。
可以感知实体世界信息的传感器和相关的感知技术会越来越成熟,越来越便宜。在线下业务中,计算机系统可以通过物理方式接收线下信息或帮助完成线下操作。这个转变意味着人工智能从线上的“虚拟世界”走进了线下的实体世界。这个阶段,人工智能的商业化会首先从生产力的角度切入,整个世界的生产制造会逐渐被AI渗透。工业机器人、仓储机器人、物流机器人等将在这个阶段实现大范围的普及。
第三阶段
当成本技术进一步成熟时,AI会延伸到个人场景,全面自动化的时代终将到来。
随着技术的日趋成熟,相关的智能产品价格大幅下降,AI终将从企业应用进入个人和家庭。那时,每个人的工作和生活中,大量的应用场景都会因为AI的帮助而更加自动化、更有效率,人类的生活质量终将因AI的普及而大幅提升。这个阶段里,AI商业化的核心目标是创建全面自动化的人类生活方式
根据汪华的判断,我们目前正在进入A商业化的第一个阶段,也许只需要3年的时间,AI就可以在各种在线业务中得到普及。AI商业化的第二个阶段,要花5~7年的时间才能充分发展起来。而标志全面自动化的第三个阶段,需要十几年的时间。
AI创业的五大基石
清晰的领域界限
人工智能创业,要解决的领域问题一定要非常清晰,有明确的领域边界,因为这一类问题是今天以深度学习为代表的人工智能算法最善于解决的。例如,同样是做机器人,如果做一个借助视觉传感器更好地规划扫地线路、提高清洁效率的扫地机器人,将机器人的需求限定在一个有限的问题边界内,这样的解决方案就相对靠谱。
如果上来就要做一个长得像人一样、可以与人交流的人形机器人,那以今天的技术,做出来的多半不是人工智能,而是“人工智障”。
闭环的、自动标注的数据
针对要用AI解决的领域问题,最好有在这个领域内,有闭环的、自动标注的数据。例如,基于互联网平台的广告系统可以自动根据用户点击以及后续操作,收集到第一手转化率数据,而这个转化率数据反过来又可以作为关键特征,帮助AI系统进一步学习。这种从应用本身收集数据,再用数据训练模型,用模型提高应用性能的闭环模式更加高效。谷歌、百度等搜索引擎之所以拥有强大的人工智能潜力,就是因为它们的业务,比如搜索和广告本身就是一个闭环的系统,系统内部就可以自动完成数据收集、标注、训练、反馈的会
过程。
千万级的数据量
今天人工智能的代表算法是深度学习。而深度学习通常要求足够数量的训练数据。一般而言,拥有千万级的数据量是保证深度学习质量的前提。当然,这个“千万级”的定义过于宽泛。事实上,在不同的应用领域,深度学习对数据量的要求也不尽相同。而且,也不能仅看数据记录的个数,还要看每个数据记录的特征维数,特征在相应空间中的分布情况,等等。
超大规模的计算能力
深度学习在进行模型训练时,对电脑的计算能力有着近乎“痴狂”的渴求。创新工场曾经给一个专注于研发深
学习技术的团队投资了1000万元人民币。结果,团队建设初期才两三个月时间,仅购买深度学习使用的计算服务器就花掉了700多万元,一个类型的深度学习任务,通常都要求在一台或多台安装有四块甚至8块高性能GPU芯片的计算机上运行。涉及图像、视频的深度学习任务,则更是需要数百块、数千块GPU芯片组成的大型计算群。在安装了大型计算集群的机房内,大量GPU在模型训练期间发出比普通服务器多数十倍的热量。许多机房的空调系统都不得不重新设计、安装。在一些空调马力不足的机房里,创业围队甚至购买了巨大的冰块来协助降温。
顶尖的AI科学家
今天的人工智能研发还相当依赖于算法工程师甚至是AI科学家的个人经验积累。水平最高的科学家与普通水平的算法工程师之间,生产力的差异不啻千百倍。人工智能创业公司对顶尖AI科学家的渴求直接造成了这个领域科学家、研究员的身价与日俱增。谷歌雇用杰弗里·辛顿、李飞飞,Facebook雇用扬·勒丘恩,据说都开出了教百万美元的年薪。国内AI创业公司如旷视科技,也用令人瞠目的高薪,将机器视觉领域的顶尖科学家孙剑“挖”了过来,把任公司的首州时科学家。
3 AI是中国创新、创业的最好机会
4 创新工场的AI布局
把握时机对创业和投资至关重要。创新工场根据技术成熟度和未来发展趋势,将人工智能各应用领域划分为现阶段已成熟、3到5年成熟、5到10年成熟、10年后成熟等不同类型,并分别设计相应的投资策略。
如图中所示,创新工场将人工智能领域的应用划分为大数据、感知、理解、机器人、自动驾驶等不同门类,每个门类中,按照人工智能技术的成熟度,将具体应用领域排列在时间维度上。
总体来说,人工智能在互联网、移动互联网领域的应用,如搜索引擎、广告推荐等方面已经非常成熟。在商业自动化、语音识别、机器视觉、手势识别、基础传感器、工业机器人等方面,人工智能可以立即应用,立即收效。
金融类人工智能的应用虽然已经起步,但尚需一段时间才能真正普及。智能教育、智能医疗、AR/VR中的人工智能、量产的传感器、商业用机器人等,预计会在3到5年成熟可用。
可以供普通技术人员乃至非技术人员使用的人工智能平台(包括计算架构、算法框架、传感平台、云服务等),会在3到5年后趋于成熟并拥有足够大的商业机会。
通用的自然语言对话工具、智能助手、普及型的家用机器人等,则至少需要10年甚至更长的时间,才有可能完成商业化。
另外,在自动驾驶领域,3到5年内,必将是第2级到第3级的辅助驾驶最先大规模商用,而且,鉴于安全考虑,这些自动驾驶应用也会是限定场景、限定道路等级的。真正意义上的“无人驾驶”,即第4级或第5级的自动驾驶,还需要5到10年才能上路运行。
我的理解:
跟着“数据”走,哪里有质量高的大数据,哪里就有金子。