在精读丨读完这本书,你将成为控制未来2%(一)中对吴军博士的《人工智能》进行了部分内容的解读,对数据和大数据人工智能进行了解读。在此我们回顾一下:
数据:把不确定性世界化作确定性的重要方法。采用数据获取、分析、建模、预测的模式完成对世界的认识和应用。
大数据:对某件事情所产生所能搜集到的全部且相关的数据进行采集,因此具备数据量大、多样性甚至具备及时性三大特征。
人工智能:具备基本功能语音识别、机器翻译、自动写作、与人下棋、自动回答人类的问题。其实这些过程都是将人日常行为不断细化后,使用大数据将这些问题变为数据的搜索、抽取、组合、编码输出过程。
对于世界的认识,我自己建立了一个认知模型,将世界分为,我、出我之外的客观世界。那么看待世界的方式则变成了,看待我自己、分析除我之外的世界,以及如何与我之外的世界进行更好的联系。
前文关于大数据和人工智能知识从我们自己的角度去看待这个问题。那么接下来,我将从大数据人工智能自身的角度和我们与大数据人工智能如何进行联系继续精读《智能时代》。
3/6:思维的革命
在继续精读前,说两个人类常见、常用的推导方法:演绎法和归纳法。
在《智能时代》中,吴军博士提到,在2000多年前的希腊,众多学着依据逻辑推理,构建了现在科学的基础体系,同时将人类带入了机械思维时代。
所谓的机械思维是一种确定性的思维,它人为世界的变化是确定的、有规律的,而这些规律可以描述或使用公式,同时这些规律能够广泛应用。它的核心就是把世界确定为一切都有因果关系,但凡有因必然有果。而机械思维的弊端也显而易见,他否认了不确定性和不可知,一旦确定性被打破那么所有立即崩溃。就像《三体》中,三体人向地球发射了一个额外的中子、质子什么的,就让人类几千年来建立的科学体系全部停止前进,因为无法将那个多余的中子、质子什么的不确定性变为确定。
随着时间发展,第一次工业革命,和第二次科技革命,机械思维发展到了巅峰,但是随着第三次科技革命的开始,人类对世界的观察和认知逐渐加深,机械思维开始力不从心。
为什么到现在科技在进步反而不确定性比一百多年前更多呢?这恰恰就是科技进步的结果,如果说科技进步和不确定性有因果关系,他们就像一个复利的过程。科技进步带来对世界更深的观察,发现更多不确定性,同时继续发展科技来消除不确定性。这仿佛一个死循环。其实这个死循环很好理解,不确定性的增加表现在影响事情因素变多,这些影响变量之间的作用以及产生的效果具有不确定性;事情因为收到诸多因素的影响,事情发展到最后与模型计算的精度具有不确定性。
机械思维之所以无法适应,就是现在很多事情无法用简单的公式来描述,而且事情因素之间因果关系难以确定,甚至互为因果。就像《三体》中三体星人的三个天体的运动,充满了不确定性,因此三体星迫切需要占领地球。
第三次科技革命让人类进入了信息化时代,信息量和信息传播的速度呈几何速度爆炸式增长。这也给我们消除不确定性带来了契机。
因此在机械思维之上,进行了进化,形成了信息论。即不确定性的存在是由于信息的缺失或者不对称,只要输入获取大量相关信息就能消除不对称。
《智能时代》中提到了信息熵,可能只有少部分理工科的人接触过这个“熵”的概念。对于书中信息上的概念,我自己将其简化为,我们现在的状态所含有的信息量与我们要确定一个不确定未知事物所要获取的信息量之差就是信息熵。比如买一个苹果要10块钱(所属权不确定性),我只有2块钱(确定性),所以必须再凑齐八块钱(信息熵)才能把苹果变成我的(所属权确定性)。而不确定性的系统大小决定了信息熵即我们所要获取信息的大小。同时我们获取信息量的大小能够将决定系统的完备性。
对于信息的获取,美国数学家、信息论的创始人克劳德·艾尔伍德·香农提出了香农三大定理,形成了信息论的基础。得益于三大定律在20世纪人类的第三轮科技革命在电子信息方面突飞猛进。我们能够利用电子信息技术获取大量信息来消除不确定性,同时继续使用机械思维,找寻各种现象的因果关系同时生产一系列复杂的公式。
无论是机械思维还是信息论,抛开对待不确定性的处理形式不说,他们的思维模式的共同点是要找到因果关系,确定规律的确定性。然而带来的电子信息技术却引起的思维的第三次革命,这就是大数据思维。
大数据思维的基础其是信息论,但是与信息论不同的时,大数据思维并不纠结在找到事情之间的因果联系。而是直接使用统计将所谓因输入,得出结果,只要是在统计之内能够满足要求就按照此法执行。这里我尝试对大数据思维进行假设:
①事物影响因素太多,但不论影响再多同样的事情会不断重复发生;
②信息技术发展能够采集到全面事情发展的数据;
基于这两个假设,那么在对数据进行统计分析后能够必然的发现数据之间有一种冥冥之中的相关性,可能无法描述。而其中的统计就是为了建立系统的完备性,他的思路参照了穷举法,在数据收集之间不经意的完成了各种的类型的分类和统计。用一句老话来说“林子大了什么鸟都有”。现在大数据就是把林子里面全部的鸟都爪走了,无论这个林子里面再出什么鸟,只要看一眼就只是是什么鸟,吃什么食要怎么处理等等。
举个我自己在工作中应用的例子:
一般碳氢化合物燃烧过程单位质量与氧气的体积比在,1:2.5之间。我工作的单位以前没有这种计量系统,操作全凭人工经验。在增加了有计算机和计量器具的燃烧阀组后,我让操作人员1个月内,凭照他们20多年经验调控燃烧强度,不要管计量器具,当然他调控的过程全部会记录下来(大数据采集)。而我自己早以计算和理论上各种的碳氢化合物燃烧最佳比例2.2~2.4(机械思维确定因果关系)。1个月后,我对计算机中的数据进行统计分析,得出来的数据是2.3~2.4几乎与我的计算相当。
这个例子如果用大数据思维就是,操作人员凭20多年经验操作,计算机统计分析后得出一个比例值,操作人员完全可以以后按照这个值来操作。完全能够不去找原因为什么要按照这个比例来控制,当然从工作角度我需要找到这个原因。
4/6:大数据与产业变革
大数据其实已经开始充斥在我们的生活中,可能你已经感觉到了。举几个例子:手机APP第一头条,在你看过某个新闻后,会推送另外一条与此相关或类似的新闻。淘宝首页的商品推送会与你近期浏览或购买的商品有关。豆瓣FM私人频道会根据你喜欢的音乐推送一些风格类似的音乐。这些例子举不胜举。
在商业上,大数据的应用趋势就是收集用于信息提供定制化服务,即收集你的信息,提供你想要的,看起来多美好,也很恐怖,因为感觉上像你在被操控。
那么在企业的产业上,依旧遵循着新技术+原有产业=新产业的模式,从蒸汽机、电能、电子信息技术包括大数据和人工智能都将遵循这个等式。发展的必然结果就是生产力的大幅度提升,产品稀缺将成为过去式,同质化产品不具备竞争力,只有提供个性化、定制化、差异化的服务才是企业的出路。用户信息将成为争夺的主战场,相信各位能够经常从新闻中看到现在社会上不少不法分子在交易个人信息。
当然违犯法律侵害广大人民群众切身安全和利益的行为必然受到法律的严厉制裁。正规渠道又如何获取信息呢?
我既不是程序员也不是专业电子信息专业的出身,但是我还是大胆的猜测一下。我们用手机、PC端通过互联网联系起来,我们自己在互联网上,就是以手机号、IP等信息作为识别代码。我们每一个操作、点击、地理位置的移动都通过APP、GPS、网络传输到服务器中,形成了一个个数据。这就促使了各种智能穿戴设备的研发和上市,就连一个插座和煮饭的压力锅都要搞个WIFI,难道是真的想广告所说的一样,在外面能够控制?其实是为了收集用户数据。不过说真的普通人能够做到数据采集还真的很少。
但是有的时候思路可以转变一下,我们可以大胆的推测大数据产业的商业模式,猴子(数据挖掘公司)收集羊(用户)身上的鸡毛(相关数据)卖给牛(数据需求方)。我们没有要做猴子从数据开始做,可以直接做牛,直接买数据(正规取道)用来改善自己的商业模式利用这些大数据消除自身商业模式的不确定性。因此未来的公司可以不参与到大数据和人工智能的开发中,但是一定要有大数据专家参与。
未完待续······
接下来,我将继续为您精读《智能时代》。
在《精读丨读完这本书,你将成为控制未来2%(三)》中将解读大数据对我们个人生活的影响、我们将如何应对大数据对我们生活的影响,同时我讲分享我对完《智能时代》后的感悟,以及在现实生活中的一点大数据小应用思路和案例。
敬请期待!!
END
文/四季道
如果觉得今天的文字希望能够对你有用,就亲关注我或击下方爱心,如果可以请转发让更多的朋友能够看到。
你的回复、喜欢、转发是我坚持、进步的源泉。