读《智能革命:迎接人工智能时代的社会、经济与文化变革》

一直以来对百度的印象都不是很好,其在商业上的诸多行径,与谷歌的“不作恶”的高姿态形成的极大的反差。锱铢必较未尝是坏事,但有违商业伦理与道德就另当别论了。

传统的印象与口碑中,百度就是一个利用不平等竞争形成的有限垄断市场中肆意妄为的反面典型。反观阿里巴巴,由于有马云加持,所有的新技术研发和市场延展都获得了很好的正向关注。但读了这本书以后,我也是对百度在技术前瞻性研发和市场应用,又有了新的认识。不由感叹,有资源还是好啊。

当然,这不是读这本书的目的。

全书中,李彦宏通过阐述他和百度团队对AI智能的理解和实践,让我对AI应用逻辑和场景应用有了更深入的理解。

这段时间分别拜读了吴军老师(Google)、王坚博士(阿里巴巴)、王延峰(上海交大)和李彦宏(百度)的书,也算是交叉学习比较完整了。


这本书的两个序言的作者倒是很有意思,一个是著名的科幻作家刘慈欣,一个是百度AI。AI跟科幻到底有多远,又有多近?在这场革命中,是不是认知限制了我们的边界?


本书中提及2012年飓风致纽约大面积停电,而高盛空荡的大楼却灯火通明(引起非议)。与吴军老师提到的“2%的人将控制世界”,也算一种呼应吧。

作者简介:

李彦宏,百度公司创始人、董事长兼首席执行官,所持有的“超链分析”技术专利,是奠定整个现代搜索引擎发展趋势和方向的基础发明之一。


书摘:

01简史:互联网风云背后的人工智能生长


SMT(统计机器翻译),基本思想是通过对大量的平行语料进行统计分析,找出常见的词汇组合规则,尽量避免奇怪的短语组合。

NMT(基于神经网络的翻译)。

SMT以前用的都是局部信息,处理单位是句子切开以后的短语,最后解码时将几个短语的译文拼接在一起,并没有充分利用全局信息。NMT则利用了全局信息,首先将整个句子的信息进行编码(类似人在翻译时通读全句),然后才根据编码信息产生译文。


在这种机器翻译的模式中,人类要做的不是亲自寻找浩繁的语言规则,而是设定数学方法,调试参数,帮助计算机网络自己寻找规则。人类只要输入一种语言,就会输出另一种语言,不用考虑中间经过了怎样的处理,这就叫作端到端的翻译。这种方法听起来挺神奇,其实概率论里的贝叶斯方法、隐马尔科夫模型等都可以用来解决这个问题。


蒙特卡洛树形搜索是对以往决策树算法的优化。


蒙特卡洛方法就体现了概率学的精妙。


作为百度大脑的云化,百度天算、天像、天工和天智平台相继向全社会全面开放百度大脑的技术和能力。


人工智能重在从混沌数据里发现总体“模式”,进而优化生产、服务。翻译、语音识别和图像识别的进步就是最好


今天的人工智能思路与过去不同,变思维规则问题为数据问题和策略问题。过去人类总想为计算机设计出完美的逻辑,不断把人类的种种逻辑规则抽象成函数之后输入计算机里。现在的人工智能主要基于大数据基础和算法的进步。也就是说,今天人工智能的爆发恰恰建立在20世纪90年代末互联网爆发的基础上。


02人工智能的历史使命:让人类知道更多,做到更多,体验更多


Knowmore,Domore,Bemore”。


通过神经网络计算的力量,下一波的人工智能技术可以在以下两个维度提升目前的计算系统:一是自动分层特征/表示学习。这是机器学习容量的实质性提升,因为当今机器学习工作的很大一部分关键在于特征工程。如百度大脑已经拥有万亿级的参数、千亿级的样本和千亿级的特征训练。二是高级认知,特别是感知能力。这是下一代设备(如无人驾驶汽车)和下一代平台(如自然语言会话)产生的巨大催化剂。


一是自动分层特征/表示学习。


二是高级认知,特别是感知能力。


人工智能计算的另一个发展方向是组织各种服务于特定物理架构和物理要素的系统,如家、办公室、工厂等的智能系统。其基本模式是通过使用物联网传感器的各种原始信号,人工智能的“感知系统”会对物理架构进行识别和感知;而“认知系统”需要组织信息和学习更多关于物理架构的知识,并去预测、判断和决策,以使各类物理系统更加智能。


在科研领域,人工智能计算可以提供更先进的建模能力,成为多领域和新一波科研浪潮的催化剂。


在商业方面,人工智能可以提供额外的机会,为企业组织创建集成的业务计算系统(BusinessComputingSystem,BCS)平台。如记录业务对象(如系统设计模型、交易记录)和业务流程[如ERP(企业资源计划)、CRM(客户关系管理)];或者系统设计并模仿人类工作活动,如沟通、协作、阅读、写作、寻求信息等。


人工智能的“感知系统”有更广泛、更新的商业机会:一方面,可以构建和部署更多的“传感系统”的子系统,针对的是物理环境或物理系统,如装配线、工厂等。这使得未来人力密集的制造业、商业服务业等,可以采用更先进的信息


信息工具和更强的自动化。另一方面,自然语言处理技术的迅速进步使得我们可以扫描和分析文本文档和信息,并从中提取各种高价值的业务知识,而构建和部署专用的“文本理解子系统”可以得到很多高价值的知识和商业回报。


对商业机构来说:好消息是它们将有许多提升、转化和进入新的增长领域的机会;坏消息是当大浪潮席卷时,没有谁可以岿然不动,如果你没有抓住前进的机会,你就会落后,甚至被时代抛弃。


有两种类型的计算系统被人类叫作人工智能。第一种,本质上相当于“智能计算系统”(ICS)的子系统框架。它将数据作为输入,从数据中提取信息并建立模型,将我们关心的某些现象转化为知识。我们称这种类型的人工智能系统为“通用智能系统”(GeneralAI),并定义“通用智能”的意思是一台机器获取知识和实现目标的能力。


第二种,指具有类似人类的认知能力,能感知(“看”“听”“感觉”),它们可以越来越多地推理和计划,它们可以用感觉运动控制移动。我们称这种类型的人工智能系统为“认知智能系统”(CognitiveAI),是具有感知、推理、规划和感觉运动控制能力的机器。


人工智能系统的另一个二分法是“狭义AI”(NarrowAI)和“广义AI”(StrongAI)。“广义AI”是使用相同的算法来解决一大类问题的系统。原则上,“广义AI”系统可以学习和适应以解决新的问题,而无须人为干预。“狭义AI”系统使用特定算法来解决特定问题,如下棋、识图等。


通用人工智能系统的核心能力就是通过运用算法、计算体系,把知识从数据里提取出来。


最近几年深度学习的突破主要是在感知层面,特别是视觉和语音识别,还有自然语言的理解。但这只是起步,接下来要做的是认知上的,因为感知只是把外部世界通过光感、声音的振动,或者语言的交流,变成可以被系统识别的符号。最重要的还是理解它的意义是什么。


实力”。搜索技术是人工智能的先驱,也是最早的互联网数字化世界的门户,其开发流程和技术核心为未来的人工智能奠定了基础。首先,搜索引擎必须与很大规模的数据打交道;其次,搜索引擎必须同时有大规模的机器学习,人工来做是不可能的事,因为数据规模太大了;最后,也是最根本的一点,搜索引擎的开发流程和工程开发文化与人工智能系统的开发是非常吻合的,都以数据为主,通过抽取其中的特征、模式,然后用这个模式给用户带来价值。


在企业人工智能战略的执行阶段,首先要坚持“结构完整性”原则,即在产品体验、技术架构以及商业模式上要连贯一致。


其次是企业要紧跟人工智能浪潮的技术路线图,与当前飞速发展的深度学习技术同步是必不可少


投资力度是企业亟须考量的重要因素。


鉴于人工智能浪潮基于与以往完全不同的核心技术(以神经计算为核心),它需要高层管理团队的高级管理能力。同时,人工智能驱动的新兴行业是如此多样化和跨学科(从基因学到机器人,凡是你可以想到的),因此企业需要一个具备创新精神的人(


数据—知识—用户体验—新的数据的反馈循环。对这个反馈循环的容量和速度进行优化是规划中非常重要的一环。


03在大数据与深度学习中蝶化的人工智能


神经网络类似人类大脑,由一个个神经元组成,每个神经元和多个其他神经元连接,形成网状。单个神经元只会解决最简单的问题,但是组合成一个分层的整体,就可以解决复杂问题。


具有空间性分布数据的CNN(卷积神经网络)和应对具有时间性分布数据的RNN(递归神经网络,又称循环神经网络)。


深度学习神经网络模拟了人脑的神经节点,每个节点实际上就是一个函数调节器,无数函数彼此交叉连接起来。通过数学上的矩阵、优化、正则式等各种方法,深度学习过程不断调整着每个函数系数的权重,在数据充分、构造原理合适的情况下,不断演化的函数会越来越准确地拟合大部分数据,于是我们就可以通过这套函数来预测尚未发生的情况。这个过程就是我们所说的“训练”。


这就是“监督学习”——依赖大量有标签的数据。


王海峰认为思考和获得知识的能力成就了今天的人类,这种能力需要通过语言来找到思考的对象和方法,并外化为我们看、听、说和行动的能力。相对于这些能力,语言是人类区别于其他生物的最重要的特征之一。


仅就知识图谱来说,基于不同的应用需求可分为三类:实体图谱(entitygraph)、关注点图谱(attentiongraph)和意图图谱(intentgraph)。


04中国大脑计划:自下而上的超级工程


“人工智能基础技术层”包括语音识别、图像识别、自然语言处理以及所有的知识图谱、商业逻辑和用户画像。


百度宣布将向社会免费开源人工智能深度学习平台PaddlePaddle,开放百度大脑开放平台ai.baidu.com。前者为开发者提供算法编程环境,后者为应用开发者、数据工程师、数据科学家提供现成的百度人工智能成果接口。


斯坦福人工智能实验室负责人、全球著名图像识别数据库ImageNet创始人李飞飞这样描述:“从科学到科技再到产品,就像一个4×100的接力赛,每一棒都有它特别的功能,学术界应该算是这个4×100接力赛的第一棒,工业界和实验室是第二棒,产业化、投资是第三棒、第四棒。”


从国情来看,中国发展人工智能较欧美国家有着更强烈的内在驱动,这种驱动来自民间。百度搜索统计显示,有关“服务”的搜索请求数量始终在迅速增长:2014年比2013年增长了133%。2016年在基数更大的情况下,仍有153%的增长。


05中国智造与文明升级


按马斯洛的需求层级理论,越低级的需求,越容易量化,共性越大,相应市场规模越大。


亚当·斯密在《国富论》中指出,规模是分工协作的前提。越高级的需求,如果要增加产品,相应的分工协作就越复杂,会降低效率,损失规模效应。


德鲁克的《管理的实践》开宗明义,企业的目的是创造顾客。当生产力扩张,消费需求将被释放或者创造出来。


形成。新工业范式将把旧工业范式颠倒过来,不再是技术的突变引导需求的渐变,而是无限地拓展需求层级和种类,以需求的突变引导技术的渐变。


扩大内需不应该被理解成旧需求层面上的扩张,而是前所未有的多样化需求被开发出来。在旧工业范式下,依靠的参照系只有已知技术和已知需求两条小路,人类凭着自己的计算和洞察摸着石头过河。而今天,人类无穷多样性的细分需求,需要依靠人工智能深度学习系统才能捕捉。


控制论领域大奖诺伯特·维纳奖的首位华人获得者,中科院自动化研究所副所长王飞跃指出:“工业自动化将向知识自动化转移。”新的生产过程将具备如下特性:对人类生活多样性的自动跟踪;知识的自动化习得;工具的自我复用和进化;对社会管理的自动优化;生产流程根据知识进行自动调整并生产出新知识……以此形成新的循环往复规律,革新工业经济范式。这个过程将挑战过去生产方式的一切环节,从生产布局、设计流程、渠道建设直到科层制的企业权力结构。“中国制造”也将因此而蝶化为“中国智造”。


10遇见智能时代的你


真正决定我们职业未来的,是我们是否具备智能时代需要的职业素养。

11美丽新世界严肃新问题


中国产业链完整、工作场景多样、人才层次丰富,这是宝贵的财富。科学家和工程师应该有意识地深入生产场景,把智能技术与工业实践和生活实践结合起来。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,761评论 5 460
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,953评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,998评论 0 320
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,248评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,130评论 4 356
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,145评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,550评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,236评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,510评论 1 291
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,601评论 2 310
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,376评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,247评论 3 313
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,613评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,911评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,191评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,532评论 2 342
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,739评论 2 335

推荐阅读更多精彩内容