[智能之心]人工智能时代华丽揭幕

21世纪人工智能(AI)时代揭幕，可比19世纪全球通电，20世纪世界入网。由于机器算法发展和人类发展需求已经匹配，AI发展近五年明显加速，2017年人工智能时代揭幕，人类发展进入新阶段。

一、人类发展的重新起步阶段。人工智能让人类从新审视人、动物与机器的关系。人工智能的时代是电子神经元取代生物神经元的时代，计算机将超过人类智能和接替代理人的大部分功能。从这个意义上说，人类从通往自由王国的大门已经打开，劳动把人和动物区别开，未来是劳动把人与机器区别开。神经网络和深度学习会繁荣很长时间，一百年或许太远，但一些重要应用改变几个大行业的路线图已经很清晰。AI进展最快的领域正是人能做得到的领域。比如自动驾驶。人类能驾驶，所以AI也能驾驶。在医学影像阅片和分析上，人类放射科医生能够阅片，所以AI也很可能在未来几年内做到。而人类难以做到的事情，比如预测股市变化，AI可能也难。原因1：人类能做的，至少是可行的；原因2：可以利用人类的数据作为培训样本，比如前面提到的输入A和响应B;原因3：人类能提供指导。如果AI对某个放射影像的结论有误，设计者可以向医生请教，医生所做的正确结论的原因是什么？进而对AI进行改善。在Andrew Ng所接触到的80-90%的AI项目中，都遵循这一规律：在人类能做到的领域，AI的进展更快。很多项目的发展一旦超越人类水准，发展也会变得缓慢。这也带来一个社会矛盾：如果AI和人的水平类似，实质上是跟人类竞争。AI对就业带来的影响更让人担心。有些AI项目确实是瞄准了某些人类岗位，而从事这些工作的人并不清楚严重性。硅谷创造了大量财富，但也应该对其造成的问题承担责任，比如造成的失业问题。AI取代人类岗位的现实问题，更应该引起重视，而不是被邪恶AI的炒作转移了注意力。AI确实正在取代人类的一些岗位。当某些岗位被AI取代后，我们需要新的教育系统，来帮助失去工作的人获得新的技能。政府应该为这些愿意学习新技能的人，提供基本收入保障，重新成为劳动者的一员。我们需要新的系统和结构，来让帮助社会向新世界进化。虽然会有新类型的工作，但工作岗位的消失也比以前更快。

二、通往未来的科技基础。有没可能取代人类大脑？我们不清楚人脑如何工作，所以很难造出取代人类大脑的神经网络。什么是神经网络？先看个最简单的神经网络：如果想输入房屋面积，得到房屋总价，可以用面积-总价的一阶近似的线性模型来描述这个神经网络。或者用更多因素建模，比如通过面积和卧室数，从第一个神经元得到可以支持的家庭人数。再通过所在地址的邮编和社区富裕程度，从第二个神经元得到附近学校的质量。就成为一个神经网络。面积、卧室数、邮编、社区富裕程度属于“输入”集合A，总价属于“响应”集合B。好处在于，当训练这样一个神经网络时，用户无需关心中间因素，诸如家庭人数、安全度、学校质量等，也无需关心每个神经元如何将输入映射到中间结果。只需要给出输入集合A和响应集合B，神经网络将自动形成中间的计算过程和参数。当A和B的集合足够大，神经网络可以自动算出很多东西。神经网络看上去非常简单，让很多初学者觉得有点失望，但它确实能解决很多问题。关键在于数据量要够大——几万或几十万个样本本身能提供大量的信息，而软件本身只是一小部分。现在的大型AI团队包括机器学习和高性能计算，才能获得足够计算能力。AI团队里的这两种人员都专注于各自领域，没有人能两者兼备。如果只是5-10人的研发团队，很难获得这样规模的数据。百度这样的大企业的经常推出一些新产品不一定是为了营收，而是为了数据，然后通过后续的产品来获得收益。另一个稀缺资源是人才。AI的应用需要根据具体业务场景来定制。仅仅下载个开源包，无法解决问题。实际情况下，是否适合用某种垃圾邮件识别或语音识别技术？针对某种场景，机器学习怎么用？所以各个公司都在为数据挖掘争夺AI人才，来定制AI技术，找到所需要的A和B各自代表什么，怎么找到这些数据和如何调整算法来适应业务场景。这就形成了AI产品的良性循环。最好的产品能获得最多的用户，带来最多的数据，通过现代机器学习体系，能得到最好的AI，最终让产品变得更好，周而复始。百度发布新的产品，会特别考虑怎样推动这样的良性循环，会包括相当先进的产品发布策略，比如按地理区域、细分市场等，来更好地推动这个循环。这种良性循环的理念很早就有了，只是最近变得更加明显。正如前文所述，当数据超过一定规模后，传统AI算法无法明显改善AI性能，因此数据多的优势不明显，大公司也很难保护自己的AI业务。现在数据越多，AI性能越好，大公司也更容易保护自己的优势。先做出某种产品。比如通过语音识别，以语音实现搜索；然后吸引来很多用户，用户产生数据；再通过机器学习，用数据改善产品。

三、人工智能社会应用最前沿。1.最近准确率已经提高到很有用的程度。4-5个月之前，斯坦福大学计算机系教授James Landay、百度、华盛顿大学一起展示了在手机上输入英文和普通话，用语音识别的速度比用手机输入快3倍。去年百度的所有语音识别产品年度环比增长大约100%，现在正是语音识别技术腾飞之时。美国有几个公司做智能语音控制器（Smart Speakers)，用语音控制家用设备也会很快推广。相关的操作系统和硬件都会很快发布。2.预测某用户是否会点击某广告。向受众呈现更相关的广告，为互联网营销和广告公司带来极大的赚钱机会,这可能是AI最赚钱的应用。3.人脸识别发展速度很快。因为中国的手机比笔记本更普及，很多人有手机，而不一定有笔记本。在中国可以仅仅凭手机申请助学贷款。涉及到钱，所以需要先验证身份和很多东西。这加速了人脸识别的发展。通过手机进行人脸识别，作为用生物标识进行身份认证的一种方法，在中国发展很快。在百度总部，不需要RFID卡进行认证，而是直接刷脸进门，Andrew Ng在YouTube上有一段视频。现在人们对人脸识别技术已经足够信任，并在安全要求较高的场景下使用。百度在语音识别和计算机识别上的资金投入和数据投入巨大，任何小开发团体远远无法相提并论，也不太可能有其他出乎意料的技术突破。4.很多行业都有个规律：先有数据，再有AI，比如医疗，美国电子病历（EHR）的进展很大。随着电子病历的兴起，影像胶片变成数码图片，这些数字化产生了很多数据供AI使用，并产生价值。教育需要先经历数字化，这一阶段还有很多工作要做。Andrew Ng对AI对医疗健康领域带来的影响很看好。很多现在的放射科医生会被AI影响到。如果想在放射科一直工作四十年，不是个好的职业计划。还有很多垂直领域将受到AI的影响，比如金融工程和教育。不过短期之内还不太会对教育产生实质性的影响。5.自动驾驶汽车，要用相机拍摄的图像，雷达等，组成车前方的一幅图，再由监督学习估算和其他车的距离，以及和行人的距离，这只是两个重要的AI部件，还需要其他的部件来估计5秒后车的位置，行人的方向。还有一个部件来分析，根据行人车辆等不同对象的运动情况，我应该怎么走？然后还需要算方向盘的旋转程度，以此类推。现在的AI还很初级——A到B的映射而已，不过已经推动着很大的市场。6. 计算机视觉。7.在线教育而言，主要问题是动机，人们不愿意花那么多时间来学完整个课程。这是不是最大的挑战？其他还有什么挑战？AI对在线教育有帮助。个性化的辅导已经谈论了很长时间，Coursera用AI推荐个性化的课程，自动打分，在细节上确实有帮助。但在利用AI之前，教育的数字化还有很长的路要走。8.让AI和人配合起来的前景如何？很多AI应用是基于AI自己，如果采用AI+人的混合方案？比如自动驾驶等？没有统一的规则，应该跟实际情况有关。很多语音识别是为了让人类更高效，比如通过手机。对自动驾驶汽车，可能需要10-15秒来转换控制权，因为难让容易分神的人快速接手驾驶，很困难。这种情况下，由AI独立控制更安全。所以从使用者角度来讲，人类和AI混合的自动化比较困难。光从监督学习已经看得出AI将如何逐渐改变各个行业。其他的AI形式，比如无监督学习、强化学习、迁移学习等等，都还在研究阶段，现在的市场规模较小。

四、学习与从业。1.学习。研究机构更偏好新鲜、抢眼球的东西，来发表论文。训练新研究者的办法通常是读很多论文。而大家常常忽视重复论文里的试验的重要性。不一定要把精力大量用于发明新东西，而花时间重复别人的发布结果也是很好的培训方法。和培训博士生一样：去学习和理解别人的论文，重复别人的试验，争取获得类似的结果，很快你就能产生自己的想法去推动最新的科技。对希望从事机器人相关工作的机械工程学生，有哪些和AI、机器人相关的机会比较适合？很多机械工程背景的人，在AI领域很成功。可以上一些计算机/AI课程，和AI领域的老师聊聊。一些垂直领域存在有趣的AI机器人的机会，比如精准农业。Blue River用计算机视觉来区分不同植物，比如不同品种卷心菜，选择留下哪些，除掉哪些，来提高产量。中国也生产和销售很多社交和伴侣机器人，美国还没起怎么起步。2.从业。大公司在数据和人才上有巨大优势，那么创业公司的机会在哪里？投资者可以关注哪种规模的创新？在语音识别、人脸识别上，小公司非常难与大公司竞争，除非有意料之外的技术突破。同时，也有很多小垂直领域适合创业公司，比如医疗影像。有一些疾病的病例不多，如果有一千张影像，也许就涵盖了所有所需的数据了，一些垂直领域需要的数据量也不大。另外，AI的机遇非常多，大公司会放弃很多的小的垂直市场，因为精力有限，大的机会还研究不过来。3.业务。AI是个让人兴奋的领域，同时也存在一些挑战。如何将AI融入公司业务？产品经理的职责是找到用户喜欢的，而工程师的角色是做出可行的产品。两者共同协作，才能做出理想的产品。AI是个新生事物，所以技术公司以前的流程和工作方法，不太适用。硅谷的产品经理和工程师的合作已有一套标准流程。比如开发APP时，产品经理先画出线框图，比如logo, 按钮，各个板块等，工程师再写出代码来实现。但是AI的APP无法通过画线框来描述。新产品设计流程，如设计一个交流型AI机器人：人：“我想叫个外卖”；AI：“你喜欢哪种类型餐馆？”；人：“川菜”；AI:“这些可供选择，xxx,yyy,zzz,...”。线框图只能显示对话过程，无法描述所需AI的复杂程度等。产品经理和工程师会在一起，写五十种对话，人：“请帮我定一个结婚纪念日的餐馆”；AI：“你需要订花吗？”；工程师问一些更具体的问题，比如每种场景是否都需要继续提配套产品的问题，比如谈到圣诞节时，是否要问对方要不要买圣诞装饰？一起思考，共同讨论需求和技术，很有效。产品经理常常希望了解AI能实现的，和不能实现的。一个简单的思路是：一般人能在一秒内想出来的事情，现在或很快就可以用AI自动实现。例如在发明创造上，AI可以作曲，但这很主观。20年前的技术做出来的曲子有人喜欢，有人不喜欢。有些项目用AI制作图片特效，用特效模仿某画家作品，这些都是小而有趣的领域。现在还看不到有什么技术路线能发明复杂的系统。对AI的宣传里，有很多吸引眼球的技术，不过它们未必最有用。如何将吸引眼球的技术和产品、业务相结合？软件产业已经有标准流程，比如代码审查、敏捷开发等，如何组织AI的产品工作，有很长的路要走，现在正是考虑这些问题的时候。通过仔细地建模和规划，用AI解决的复杂问题？对这些问题，人类可能需要进行长时间的思考。亚马逊是个很好的例子。它知道我浏览过什么，读过什么，比我太太更了解。电脑对人们看过什么，点击过什么广告更了解，所以在广告方面做得非常好。对于有些任务，计算机可以处理的信息量远远超过人类，并根据规律建模，进行预测，这方面AI比人做得更好。复杂的AI系统有很多小AI部件，工程人员要知道如何将这种超级学习能力融合到更大的系统里，来创造价值。

五、人工智能的社会伦理热议。许多人担心人工智能会不会取代或威胁人类，但这是一个有害幻想。部分研究人工智能的人专门炒作“邪恶AI”，以获得研究“反邪恶AI”投资。此类有害幻想类似于担心火星未来人口过剩。机器智能和人类意识没有严格区分，机器也可以具有意识，人类本质上也是机器，是一台由无数个小机器组成的巨大机器，它包含数万亿个移动组件，复杂程度无以复加。大脑中数十亿个神经元每一个多多少少是机器的，所有神经元集群交互最终汇聚成了意识。人类社会的制造、运输、农业、医疗、金融等行业，都是人类意识的产物，人工智能变革的只是社会形态，而非本质。产品经理和社会学家、律师等如何协调？比如自动驾驶汽车在撞人前，开发者和AI应从驾驶者，还是行人的角度考虑问题？这只是个法律问题，但也有很多类似情况。产品管理者和不同的功能部门的合作时，应该扮演什么角色？这个问题的一个相似版本是“有轨电车”问题，会产生伦理矛盾。一个电车走到岔道口，继续往前会撞死5个人，你可以用扳手将电车扳到另一条轨道，撞死该轨道上的一个人，而你成为凶手，你扳吗？除了在哲学课里，很少有谁在现实生活里遇到过这个问题，所以，它并不重要。自动驾驶的开发者没去讨论它。实际上，如果谁真正遇到了，可能之前已经犯了其他错误了。自动驾驶处理的问题更实际，和你自己开车一样。比如，对面有个白色的大车，是否能及时刹车？

六、技术探索领域。1.AI融入人类很大一部分，是将一块块的AI部分串成一个大系统。当以前的机器学习算法性能上升到一定程度，即使再增加数据样本量（前文谈到的输入A、响应B的A-B映射），性能改善也很有限。似乎超过一定样本量之后，再多的数据也对算法不起作用。而过去几年，主要由于GPU，我们终于实现了能利用这么巨大的数据集的机器学习软件。将数据输入一个小的神经网络，当超过一定性能后，上升变得平缓。而不断地把数据输入一个很大的神经网络时，即使性能上升没有那么快，也会保持上升趋势，随着数据量的增大，不断提高。因此，要想获得很好的AI性能，需要两样东西：很大的A-B映射的数据集；大的神经网络。现在常用的大型神经网络建立在HPC高性能计算集群上。监督学习驱动百亿的市场容量的，基本上属于同一种AI: 监督学习（Supervised learning），即用AI来确定A-->B的映射——输入A和响应B的映射。用Email作为输入A，判断是否是垃圾邮件是响应B。用图像作为输入，识别这是一千种物体中的哪种？从声音A到文字B，从英文到法文，或从文字到声音。软件可以学习这些输入A到响应B的映射——有很多好的工具来让机器学习。比如50,000小时的音频和对应的文本，就能让机器学到如何从音频内容转化为文本内容。通过大量的电邮数据和区分垃圾的标签，也可以很快地训练出一个垃圾邮件过滤器。AI研究较前沿的团队都比较开放，常常发布研究成果。百度的AI研究论文也没有隐藏什么成果——在人脸识别等论文里，都分享了所有的细节。既然很难把算法本身隐藏起来，如何保护AI业务？当前稀缺资源有两种，一种是数据，二是人才。获取巨量数据很难，要包括输入A+响应B。比如语音识别用了5万小时的音频来训练，今年准备用10万小时，相当于百度10年积累的音频。以人脸识别所用的训练图像数量为例，学术上最常用的基准测试/比赛：1百万幅；所用图像数最多的计算机视觉对象识别学术论文：1500万幅；百度用来训练世界上最先进的人脸识别系统：两亿幅！百度发现，产品经理通过数据和工程师沟通，是个较好的办法。产品经理负责提供测试数据集给工程师，比如一万个音频和对应的文字，来说明所关心的问题，工程师也能更明白需要解决的问题。如果这些音频里有大量车辆噪音，工程师就知道车辆噪音是问题。如果是混合了几种不同噪声，工程师也能想办法解决。最糟糕的情况是，产品经理提供的测试数据，并不能代表自己想解决的问题，那就出问题了。2.物理。如果摩尔定律不再成立，对AI的扩展性有什么影响？一些高性能计算公司的硬件路线图显示，摩尔定律在单芯片上不再那么有效，但神经网络、深度学习所需的计算类型在未来几年仍然能很好地扩展。SIMD（单指令多数据）让并行化处理负载非常容易。神经网络很容易并行化，加速计算的空间还很大。AI面对的诸多问题中，许多问题的瓶颈在于数据，也有很多的瓶颈在于计算速度——能便宜地处理数据的速度赶不上获得数据的速度。所以高性能计算的路线图应该包括这方面。算法是AI里的特殊作料。是否应通过知识产权保护，还是绕过这个问题去设计产品？对机器学习的研究者，是否有和AI产品经理-工程师那样类似的流程或良性循环，来实现突破或改善研究流程？知识产权的问题比较难讲。有些公司申请了大量专利，但是是否真能带来实质性的保护？所以我们往往从如何从战略上思考细节，比如让数据保护自己。百度如何用AI来管理自己的云上数据中心？比如IT运维管理的例子？两年前，百度做了个项目，可以提前一天自动检测出硬件故障，特别是硬盘故障。这就可以事先拷贝、热插拔进行预防处理。还可以降低数据中心的用电量，负载均衡等，都是很多小细节的改善。

欢迎加入人工智能工作群组（现有群友为美、英、日、印等国及中国专家学者和专业人员一百余人），请添加微信88476030（注明：参加“人工智能工作群组”，所在部门及从事领域）。

最后编辑于：2017.12.06 04:38:22

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,997评论 6赞 502
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,603评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,359评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,309评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,346评论 6赞 390
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,258评论 1赞 300
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,122评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,970评论 0赞 275
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,403评论 1赞 313
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,596评论 3赞 334
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,769评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,464评论 5赞 344
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,075评论 3赞 327
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,705评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,848评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,831评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,678评论 2赞 354

[智能之心]人工智能时代华丽揭幕

推荐阅读更多精彩内容