一、相关信息
1.我的书评
这本书是2016年对我影响最大的书,共读了两遍。
读这本书之前,对大数据和机器智能完全不知晓,读完后则有一种深刻的危机感。2016年是机器智能时代到来的开端,很幸运了解了一些基本,虽然基于过去的知识积累和专业,我不是计算机科学家,但却可以借此机会建立大数据思维模式,并利用机器智能发展的成果,与自己的专业联系,或者选择投入机器智能的浪潮中,重新定位和选择自己的事业。
收获主要包含两方面内容:
第一作者用深入浅出的语言帮我理清了数据、信息、大数据、机器学习等最前沿的科技成果和应用,消除了我对大数据和机器智能的陌生感;
第二通过回顾历次技术革命带来的社会变革和影响,我对此次智能革命将会带来的挑战有了更深一步的认识,帮助我能看清自己的位置,做好准备。
2.书籍信息
3.作者简介
吴军,博士,于2002年加入谷歌公司
2010年加盟腾讯公司,出任负责搜索和搜索广告的副总裁。
2012-2014年回到谷歌,领导计算机自动问答项目。
2014年,他在硅谷创办了丰元资本风险投资公司。他在美国两家风险投资基金(中国世纪基金和ZPark风险基金)分别担任董事和顾问,也是约翰·霍普金斯大学工商学院董事会董事,以及该校国际事务委员会的顾问。
二、脉络框架
本书包括前言和七章正文。
前言
详细介绍了AlphaGo战胜李世石的过程、原因以及代表的意义。除了在围棋方面的应用外,机器智能还能完成医疗诊断、自动回答问题、驾驶汽车等任务。机器智能时代在2016年被宣布的来,我们要抓住智能时代的机遇而不回避它,成为有创意的人。
第一章 人类建造文明的基石
从最基本的数据概念、含义、作用、意义来阐述,以及局限性、如何破解局限性。
(1)首先引入数据和信息的概念,并对二者加以区分。
数据是人造的,它的范畴随着社会发展越来越大,数据有三类,有用、无意义数据和伪造数据。信息分两种,一是人造的,二是客观存在的。信息比数据更加抽象,信息可以用数据来描述。
(2) 数据的作用
数据-信息-知识-改变和进步
自古以来人类都是通过处理数据中获取信息,信息抽象出规律得到知识,由知识来改变和获得进步。因此,处理数据的能力,从数据中得到信息的能力就是大数据应用的基础。
(3)数据应用的模式
获取数据-分析数据-建模-预测
大数据之前,人类应用数据主要通过这样一种思维模式,于是决定是否能成功取决于数据是否精确,还有运气的成分——能否碰巧找到一个可以弥合全部观测数据的模型。
二者都很难
(4)大数据思维模式
通过数据之间的相关性我们不止可以获取信息,还可以得到意料之外的惊喜。如预测事件发展的特点和趋势。
我们可以利用数据之间的相关性,在无法直接获得信息的时候,通过数学模型间接获取数据。
而各种数学模型的建立离不开概率论和统计学。概率论和统计学要得到准确的结果需要样本设计非常准确,获取有代表性的数据,此外还要找到准确的数学模型。这二者都非常困难。
于是在大数据思维下,我们改变了直接寻找的思维模式,而是采用数据驱动方法——用若干简单模型替代一个复杂模型,此方法比传统的通过理论突破改进数学方法更新迭代速度要快很多,因为前者受益于数据量和机器计算能力的提升。
总结,利用大数据,采用数据驱动方法(解决IT行业的很多问题)和机器学习的大数据思维,获得解决问题的能力,是智能时代我们每个人都应该掌握的新思维。
第二章 大数据和机器智能
这一章主要讲了大数据和机器智能的发展渊源:从计算机的诞生、发展,提出机器智能的概念和发展情况,并总结了大数据的特点——大量,多维,及时性、完备性,其中最重要的特征是多维度。
人工智能1.0(1956模仿人类语言和思维)
人工智能2.0,(1970用统计+数据的方法,及数据统计和超级计算,找到数学模型后用统计方法训练处模型参数,数据驱动)
人工智能3.0(2000年后,奥科博士,老方法——数据驱动方法,大数据——用几千倍甚至上万倍数据,量变引起质变。大背景——数据之间关联性极大增强,各个维度数据从点和线连接成网)
第三章 思维的革命
前两章讲了数据和信息的基本知识,机器智能的发展,这一章从方法论和思维方式(头脑)方面阐述从古希腊时代到现代,我们人类认识世界方法的演变和发展过程——思维方式和方法论的发展,尤其是牛顿开启的机械思维向大数据思维的发展,提出了大数据思维诞生的必要性,面对更复杂的问题应用强相关性取代因果关系来解决不确定性。当然,大数据思维是机械思维的补充而不是对立。
第四章 大数据与商业
这一章主要讲的是大数据在商业等领域现在的应用和影响,通过总结历史规律提出对未来的展望。
(1)首先从微观角度入手,通过举例说明利用大数据发现的相关性,政府部门可以更有效的开展政府监测工作,商业上通过应用大数据为用户推荐更加有相关性、时效性和个性化的商品,提升竞争力,实现巨大的商业利好;
(2)紧接着介绍了大数据商业的技术基础——大数据收集、处理和建模的流程,数据由细节到整体来获得规律,再从整体到细节用规律指导每一个商业行为;
(3)从宏观的历史经验出发,通过举例和细节描述,分析了第一次工业革命、第二次工业革命、信息革命发展以来的一个共性,就是“新技术+原有产业=新产业”。新技术对经济、生活以及各行各业的影响和冲击;同时技术还在改变商业模式,进而导致社会生活方式的变化。最后总结经验给出结论,未来人们对服务的需求越来越强烈,生产和产品的优势反而会走向终结。
(4)未来商家将在数据层面和智能化方面展开竞争。但是大部分企业没必要都从事新技术本身的开发和产品研制,大数据和机器智能的工具将由专门公司提供给全社会使用,当然,这些为全社会提供技术的公司将会站在浪潮之巅。
第五章 大数据和智能革命的技术挑战
这一章主要描述了大数据出现的技术基础和面临的技术挑战。
大数据的出现是其他相关技术成熟后带来的必然结果。大数据涉及的几个技术基础包括数据的产生、存储、传输、收集、处理,都是科技进步和发展带来的副产品。
然而,大数据也给数据存储和处理带来了很大的挑战,主要原因是数据增长的速度超过了存储的效率,根本的解决方法则需要重新设计数据存储方式、开发新的存储工具、专门公司研究算法等相关技术的进步。
此外大数据发展给普通大众带来的冲击和负面影响主要表现在隐私和个人信息的泄露,一方面会对个人利益造成损害另一方面会阻碍大数据的发展。当然,目前有一些防止大数据泄露的方法。对于数据安全的考虑,个人要重视防止泄漏,社会也要开发新技术以更有效保护隐私。
第六章 未来智能化产业
本章具体描述了大数据和机器智能对各个产业造成的转变和影响(导致社会产业升级和变迁),例如农业、制造业、体育、医疗、律师,甚至编辑作者等。
这些改变的共性是精细化和智能化。
根据“已有产业+新技术=新产业”,这些智能产业与原有产业思维方式已完全不同,这些改变必将淘汰大部分普通工人,甚至是一部分脑力劳动者。那么,被机器取代的人怎么办?但是,人类需求是没有变的。固守旧产业是没有出路的。
第七章 智能革命和未来社会
大数据和机器智能引导的智能时代既是最好的时代,也是最坏的时代。
新技术将给我们的生活带来便利,让我们的社会更加精细化、智能化,人性化的,让社会资源利用率极大提高。然而,它也会给我们的社会带来冲击,例如隐私泄露、超级权利控制、失业等风险。只有投入技术浪潮,成为2%的控制这个世界的人,我们才能不会被淘汰。
这一章分4个部分,第一是智能时代给我们的社会带来的好处,作者从宏观层面(事故预警、智能交通、反恐阐述了社会智能化,从微观层面(区域链)阐述了未来社会精细化;
第二个部分阐述智能时代可能带来的社会冲击,如无隐私、超级权利控制、失业、直接影响我们的健康和医疗等;
第三部分主要分析机器人对我们工作的影响。作者通过列举之前三次技术革命对社会产生的冲击(社会财富聚集在少数人手中,幸福指数没有提升,大学毕业生就业更难,很多产业消失,一部分脑力劳动者也要被取代,社会动荡),提出消除负面影响只能时间;
第四部分,作者在描述完技术革命可能对我们的社会产生强烈的冲击后,提出解决之道——踏上浪潮,成为2%的人,希望大家接受一个新的思维方式,利用好大数据和机器智能。
三、谋篇布局
前言主要从2016年发生的“黑天鹅”事件之一——AlphaGo战胜李世石谈起,吸引读者注意。
前三章主要是基本概念和知识。
第四章和第六章都是讲大数据的应用,但侧重点和目标不同。第三章一方面是详细展开了在商业方面的应用,另一方面还是在阐述大数据和机器智能的特点、原理和作用。但是单讲理论就很枯燥,所以放在具体的实例中会显得妙趣横生。
因为主要目的还是介绍理论,所以第四章就又回到了主线,技术和理论的安全性。
第六章才是真正的应用分析。由于作者已经在第三章分析了商业,这一章主要从其他几个产业来阐述,这些行业也是逐级递进的,从体力劳动到脑力劳动,体现使用人类智慧的不同程度逐级递进。
我们会发现,机器智能不止会替代体力劳动,还讲替代越来越高级的脑力劳动,这不禁让人觉得震撼和焦虑,那么,我们应该怎么办,应该采取什么措施来应对智能时代的挑战?那就是第七章的内容了。
四、书中亮点和心得(心得用【】标注)
1.虽然机器学习和博弈树搜索算法都是几十年前大家知道的,但Google所做的工作是让这些算法能够在上万条甚至上百万台服务器上并行运行,这就使得计算机解决职能问题的能力有了本质的提高。
AlphaGo的两个关键技术:第一个关键技术是把棋盘上当前状态变成一个获胜概率的数学模型,第二个关键技术是启发式搜索算法——蒙特卡罗树搜索算法。
【相关性——万维钢老师有篇关于相关性的文章,提到科学家认为相关性在0.8以上才算强相关性,0.4以上算若相关性。很多心理学研究只是在0.3左右,其实相关性不大。在我们掌握的数据量不足,数学模型找的不准确的情况下很容易把没有直接相关性的东西强加相关性,找错解决问题的方法,以为是强相关能解决,其实不然。大数据应该会帮我们避免此类错误,以后会找到最直接相关的参数,然后针对问题对症下药,获得事半功倍的效果。
思维方式——无论是获取数据-分析数据-建模-预测还是机器学习、数据驱动,都是思维的套路,这些东西是高度凝练和内化的,需要形成冷意识(万维刚)和内力,不然每次遇到问题,从不知所措到找到方法已然又花费不少时间。从实践中找到自己的套路是2017年需要加把劲做的事情。】
【大数据思维和方法应该会逐步代替未来传统统计方法,如问卷调查。在未来问卷调查过程中,换一种思路,大数据思维思考问题。看是否能够通过直接调用数据来进行分析。变智能问题为数据问题,是未来要注重培养自己的一个方面。遇到问题的时候,换一个思路,换一种角度来考虑,换一种方法,可以另辟蹊径的解决问题。】
2.每一次技术革命,掌握了新的方法论的人才会获得成功。例如瓦特,她的蒸汽机的通用性就好很多,同一种蒸汽机可以卖到不同工厂。他的成功不仅是技术的胜利,更重要的是她掌握了新的方法论——机械思维。
【不一定要完全从事大数据开发,但要掌握新的方法论,尝试建立大数据思维。其实,不论任何时代,能够深入地进行有质量的思考是最重要的能力,也是永远不会被淘汰的能力。】
3.吉尔德定律:要尽可能多地采用便宜的资源,尽可能节省贵的资源。
【对于个人来说,注意力和时间是她最重要的最贵的资源,要尽可能节省,如何节省?要用钱取代时间,时间取代注意力?吉尔德定律,用便宜资源节省贵的资源,正如李笑来所说的,注意力是最宝贵的,要学会用钱买时间,用时间买注意力。】
4.信息的传播速率不可能超过信道的容量。要不断扩展带宽。
【人也是如此,成长的速度不可能超过认知的带宽,所以要不断扩展认知的带宽,用20%的时间去学习各个领域80%的知识,哪里水草丰美就转向哪里,做智识的游牧民族。当然,至于专业和通识教育如何平衡,也是值得研究,总的来说也是二八原则吧。】
5.智能技术的拐点可能就发生在从10年前开始到接下来一二十年这一段时间。
【这一代孩子的成长与教育要与数据挖掘和大数据科技紧密相连】
【机器智能比人厉害的多的地方在于它对经验的学习能力,例如它在短期内会比我们一辈子积累的行业经验还要多,而且数量级完全不在一个频道。那么由此可知,未来因经验处于核心竞争力的行业或人都将被取代。然而人的基本需求是不变的,我们需要改变的方向是,换一种方式和思路去满足人的需求,而这种思路和方式必定要依靠大数据。如果倒推的话,那么未来什么样的人不会被淘汰,就是那些思维和思想能够与时俱进,善于应用、使用工具,并且有创造力的人吧。】
6.在大多数产品和服务都被标准化的时代,大家很难找到最适合自己的,只能默认最权威的或者最贵的就是最好的。到了智能时代,极其的智能水平足以为我们提供各种个性化的服务,同时能够做到成本和过去的标准化服务相当。
【吴军老师问过,如果每个家里都有机器人了,你希望它能为你做什么?我想答案就在这里,我们所希望的和机器人能替我们做的,是基于我们条件的个性化产品和服务的提供。例如我们要制定旅行计划,我只要输入我的需求,它就能列出最适合我们的,性价比高的航班、酒店、车辆等信息安排,我们就可以省下比较的时间。】
7.我们也要在观念上接受这样一个事实,即越来越多的事情人类将做不过机器。我们今后的决定,应该根据这个前提来做,只有面对现实,才能最终建设一个让所有积极向上的人都具有成就感和幸福感的社会。
【在为自己或者孩子做职业和事业的规划时,首先要考虑一下,长远看,这个事儿会不会被机器替代?】