最近刷新纪录,利用周五-周日三天时间读完谷歌数据科学家吴军博士的《智能时代》。虽然表面上是讲AI(人工智能),其实更多层面上是讲大数据,毕竟作者是在全球最大的数据公司google里面做大数据的权威人士。
单纯讲数据其实是枯燥的,我先讲讲和我们生活有关的数据背后正在深刻影响我们的事例吧。
事例A:以前美国抓制毒人员成本很高,收效甚微,因为很多人租下偏远的厂房甚至大型豪宅,在室内用紫外光种植大麻,警察很难发觉,而且在美国没有搜查证根本不能去查房。大麻易于种植,用卖大麻的钱供完房租还能有超额回报,很多人挺而走险。现在就不同了,自从有了智能电表,警察可以根据某一个小区内所有住户的用电数据(不仅是用电量,还有用电时间,用电时长等数据),从而建立一个正常用电模式,那些明显不正常的用电模式显然别有用途,这样针对性下手成本就低多了。
事例B:在电商上购物,总有些人老是买到假货,有些人基本都是买到真货,是随机的吗?未必!某些电商平台或者店家掌握大数据后可以挖掘出你的家庭住址,你的收入水平,你的过往退货经历,你的差评好评数量。这样他们大概就能知道你家周围5公里范围内有没有你要买的东西的专卖店可以供你验伪,你的收入水平可以反映出你的购买力和阶层,你的退货经历可以反映出你的容忍度,你的差评/好评数量多少能反映出你这个人是“好说话的人”还是“不好说话的人”。针对这些,某些商家就可以专门给你供假货,或者好货掺杂假货。这些你根本蒙在鼓里。
事例C:现在我们买医疗保险基本上保险公司是有求必应(前提是不能隐瞒当前的病情),但以后就不同了,随着基因科技的发展,某些基因缺陷导致的疾病的概率正在被大数据统计,而某些疾病与疾病之间的关联度(比如肺结核与肺癌的相关性,得过某种疾病的人得另一种疾病的概率)也在被统计,这样保险公司在掌握这些医疗大数据后就可能造成某些人未来无险可买或者需要承担高额保费,而这些人恰恰是最需要被保险的人。
事例D:美国的第二大连锁超市塔吉特,也在利用大数据做生意,他们会根据顾客的地址,信用卡流水,购物账单,判断出你是否怀孕(仅限女士),准确率达到87%,虽然过往来看,你买一个尿不湿并不能说明你有baby了,也许你是送人或者代购,但是如果你账单里既有尿不湿,又有润肤露,又有维生素,利用这些相关数据的关联度做出的概率模型非常准,这样商家就可以给你家地址或者邮箱发相应产品的优惠券,塔吉特公司的盈利因此大幅提高。
事例E:最后说说最近这几年NBA最火的勇士队,一只在六年前还是鱼腩的弱旅为什么几年时间就成为NBA总冠军,并打破乔丹20年前的NBA赛季最佳战绩,答案也许就是勇士队的主场离硅谷很近。几年前几位硅谷的投资人买下球队,送走原来的大牌球星,以一个身高1.91M,外表羸弱的后卫作为建队核心,老板敢这么做,就是因为掌握了大数据。建立在对过去几万场比赛累计的数据,工程师发现以前的篮球风格和打法完全不是最佳策略,得两分需要杀入内线,多次倒球,扣篮或者上篮都耗元气且效率低下,三分球才是高效率的得分方式。于是勇士招来曾经的三分王科尔当教练,水花兄弟联手开创了一个前所未有的时代,引领了一股新的潮流,这是乔丹之后,科比艾佛森奥尼尔等超巨都未曾改变过的篮球传统格局,NBA从此开始改变,我作为一个老球迷,自姚明退役后再没看过NBA,但库里又把我带了回来。过去全队投三分多少有赌博的性质,现在全队投三分成了最合理最高效的团队协作方式,豪赌背后靠的是概率论。
以上分享的仅仅是5个例子,其实还有很多,当然更多大数据带来的新产业、新思维还在被迅速挖掘中,但必须注意的是大数据带来的机器智能时代已经在路上了,而不是一个概念而已。
2016年距离人工智能概念被提出刚好60周年。许多年以后,回顾谷歌开发的阿尔法狗战胜围棋大师李世石那一段往事,我们可以说智能时代的大门在2016年已经被开启了。开启这扇门的钥匙就叫做大数据(big data),为什么是冰冷的大数据,而不是想像中呆萌的机器人,作者是这样谋篇布局的。
首先作者以埃及法老墓里的数字为引子,导出了金字塔就是一个数据库,通过挖掘这些数据背后的含义可以大致了解埃及文明的程度。一开篇就揭露了数字有深意,数字是文明的基石。
紧接着作者开始指出计算机长时间是没有智能的,人类付出了很多努力想让电脑学会像人脑一样思考证明都是徒劳的,就连最基本的语音识别,最强大的电脑都无法胜任。人类在智能问题上走了长达几十年的弯路,直到近十年,当移动互联网大规模普及后,数据由量变发生了质变,解决人工智能的思路开始转变,核心就是变智能问题为数据问题,通过大数据建立模型让机器具有了智能。
AlphaGo其实不具备人类的智能,它甚至不知道自己下的是围棋,它不过是根据自己学习的几十万盘棋局建立的概率模型去完成输出任务,但结果就是他能战胜人类顶尖的棋手,比国际象棋复杂很多倍的人类顶级的脑力活动,那么为什么不能认为它具有智能了呢。
然后作者开始传递一个几百年来影响我们的思维方式,那就是机械思维。从欧几里得的几何原本和托勒密的地心说开始,人类总是想寻找一个放之四海而皆准的规律去预测或者证明未来,这里说的就是因果关系,牛顿发现了三大定律和万有引力,用优美的数学公式表达出来,从此日月星辰如何走,怎么走,都是可以被预测和证明的,将人类的智力推上顶峰,因果关系从此也被奉若圭臬。几百年来影响至今,工业革命的果实直至今日还在攫取。
但现在人们开始发现,世界开始越来越复杂,很多东西是无法建立因果关系,变量太多且互相干扰,最有名的就是量子力学中海森堡的不确定原理(也译测不准原理),微观世界其实是不确定的,位置和速度只能知道一个,并且一个知道得越精确另一个就模糊,这不是测量水平造成的,这就是宇宙设定的限制。反映到宏观世界,人们也发现了“蝴蝶效应”,巴西的一只蝴蝶煽动翅膀会引起美国的一次龙卷风,这种现象根本就是无法用数学公式表达出来的 。那么如何消除不确定,答案就是引入更多的信息,这里作者提出了信息熵的概念,就不展开描述了。那么大数据就让确定成为可能,利用越多数量和越多维度的信息,通过建立数据之间的关联性,就能用强相关性替代因果关系,于是机器智能就出现了。上文提到的事例D就是用相关性代替因果关系的例子。
这个思维方式的转变使机器智能迅速走上快车道,大数据开始与传统产业结合形成新的产业。展望未来,农业,交通,体育,医疗,金融,律师,记者,编辑在机器智能的影响下将发生翻天覆地的变化,行业将开始新一轮的洗牌,与工业革命中机器取代传统低智力的工匠不同,这一次智能革命下连律师,证券分析师这些高智商的从业者也许都会被取代,从第一次工业革命和第二次工业革命的历史经验来看,社会将会经历两代人的阵痛期来消化新技术的影响,那么如何才能成为幸运者,跨过智能革命的入口。