智能时代的来临是不可阻挡的趋势!数据是智能的基石!大数据处理是绕不开的关键技术!
连续使用三个感叹号,语气很冲,很咄咄逼人,但是也确实说明了大数据的重要性。正在看吴军老师的《智能时代》,写的很好,但是书很厚,没有看完。今天看了哈佛商业评论的一个小册子《重思大数据》,里面有五篇文章,分别讲述了大数据的建设、使用、安全性以及对管理的影响。分享一下我的感受。
过去
这些年大数据技术的应用经历了一些变化。最初是简单的数据挖掘时代。有一个很经典的例子:周五下午超市把啤酒和尿不湿放到一起,可以互相促进销售量。这个时代是数据挖掘的简单的技术应用阶段,你并不需要把根源分析出来,因为在大数据分析的结论与其说是因果必然不如说是相关性高。比如说刚才的例子,有人给出这样的结论:周末的时候男人在家看球看孩子,没空给孩子把尿,就用尿不湿,然后他看球的时候想喝啤酒,于是这两个产品之间产生了关联性。你觉得解释合理吗?无所谓,在这个应用阶段,即使你不知道这个道理也没关系,你只要有了足够的数据和简单的数据模型,一般的计算机从业人员都可以给你一个货品上架的建议。这是刚开始接触大数据应用的一个标准场景。
现在
现在这个阶段是数据挖掘的深入应用。一个企业或者一个超市,它大概应该在什么时候进行库存补充以及补充多少。这个并不是简单的说没有了就补满。要考虑到季节性、人们的消费习惯、国际国内经济形势,这个东西卖没了,有可能是过时了淘汰了人们不需要了,或者是林丹代言的产品,这样的就别补了。这就需要一些综合的知识去分析,这个时候就不是简单的计算机从业人员可以完成的了,需要数据科学家进来,对模型要进行深度的设计,要考虑的因素越来越多,才能够越有效地作出科学的决策。这也是目前大数据应用的比较好的场景。
未来
第三阶段也就是未来阶段最主要的应用,主要是一种预测能力,不仅仅是对普通数据趋势的预测。它是建立在对人和社会的行为模式分析的基础上。人的思维模式和机器的最大区别就是人有感情,人们做决定并不完全(甚至完全不)按照理性的因果关系来。现在的智能类软件,如alphaGO,在模拟人类行为的时候,通过建立复杂的神经网络,增加逻辑判断的层次,产生一种类似伪随机数一样的伪情感,看起来能够理解“局面”。因此在这个阶段的数据挖掘应用不能够完全依赖于基本数学模型,参与者要从数据科学家扩展到行为科学家、认知科学家的范围。也许有一天,机器智能能够突破感情的关口,但是在这之前,还是要通过人类专家和机器的共同努力,来实现大数据的更深层次的应用。