信息时代的到来,大数据时代为我们探索事物提供了一个非常不同的思路,并且很明显它将会帮助我们发现更多无法想象的问题及解决方法。这不仅仅是将数据量化,更是思维的一次升级。
引言
随着信息时代的发展,数据无处不在,并高速爆炸,同时大数据时代正改变我们的思维方式。大数据告诉我们“是什么”而不是“为什么”。
人类一直以来探索这个世界都是建立在因果的基础上,看到事务的发生会去思考内在的原因,并从中发现规律,总结经验。也是在这种不断探索,穷追不舍的坚持下,人类发现了现在的很多理论,可以说人类的现文明是建立在不断追问“为什么”的基础上建立起来的。但是大数据时代改变了这一切。
我们不必关心A事物与B事物的关系,但是无法数据显示A发生了某变化,B也会跟着发生变化,那我们就可以得到A变B变的结果,而无需去探索为什么,当我们需要B作某些改变时,我们只要改变A就好了。当发现某中水果对治疗癌症有效果的时候,我们又怎么会为了不清楚之间的关联,而拒绝食用该水果呢?我们不再关心为什么,我们关心的是它是什么。
相反思考,恰是大数据发现是“是什么”,而让我们有了更准确的思考方向,去探究“为什么”。
第一部分:大数据时代的思维变革
像引言中所说的,大数据时代,我们需要有思维上的变革,关心的是“是什么”,而不是“为什么”。我们不再追寻之间的因果,而关注表现出的相关关系。
- 要分析与某事物相关的所有数据,而不是依靠分析少量的数据样本
- 乐于接受数据的纷繁复杂,而不再追求精确性
- 思维发生了转变,不再探求因果关系,转而关注事物的相关关系。
更多,不是随机样本,而是全体数据
大数据时代使用全量数据能够发现很多意外的关系,而这些关系在以前的抽样分析环境下是无法想像的。慢慢地,我们会完全抛弃样本分析。
更杂,不是精确性,而是混杂性
大数据时代,数据并不统一格式化,同时也可能有错误的地方,网络传输过程中,也可能有延迟,甚至丢失。我们为了获得广泛数据而牺牲精确性,为了高频率放弃精确性,结果可以观察到一些有可能被错过的变化。为了扩大规模,接受适量的数据错误。
更好,不是因果关系,而是相关关系
大数据时代,我们需要让数据发声。相关关系没有绝对,只是一个可能性。建立在相关关系分析法基础上的预测是大数据的核心。通过找出一个关联物并监控它,我们就能预测未来。
第二部分:大数据时代的商业变革
数据化,一切皆可“量化”
数据化就是一种把现象转变为可制表分析的量化形式的过程。
- 文字变成数据:Google翻译
- 方位变成数据:预测交通情况
- 沟通变成数据:微博、twitter、Facebook用户数据
- 世间万物数据化:我们不会再将世界看作是一边串我们认为或是自然或社会现象的事件,我们会意识到本质上世界是由信息构成的。
价值,“取之不尽,用之不竭“的数据创新
数据的价值不会随着它的使用而减少,而是可以不断地被处理,产生更多的价值
- 数据的再利用:对用户搜索关键词分析用户喜好
- 重组数据:将多个数据集的总和重组在一起,扩大价值
- 可扩展数据:一开始考虑好数据的可扩展性
- 数据的折旧值:随着时间的推移,大多数据会失去一部分价值,但潜在价值依然强大
- 数据废气:用户在线交互的副产品,包括浏览了哪些页面、停留了多久,鼠标光标停留的位置、输入了什么信息等
- 开放数据:开放数据,挖掘数据的潜在价值
角色定位,数据、技术与思维的三足鼎立
- 掌握大数据的公司
- 拥有技术和专业技能的公司
- 有着大数据思维的公司和个人
- 全新的数据中间商:从各地方搜集数据进行聚合,提取有用的信息进行利
- 大数据决定企业竞争力:大数据对中等规模公司帮助不大,超大型的公司占据了规模优势,小公司则具有灵活性。大数据让处于行业两端的公司受益良多,而中等规模的公司要么向两端转换,要么破产
第三部分:在数据时代的管理变革
风险,让数据主宰一切的隐忧
- 被“第三只眼”时刻“监视”
- 隐私被二次利用:目前有法律法规规范数据的用途,但数据更多的价值在于它的二次利用,最终产生了很多创新性的用户
- 预测与惩罚,不是因为“所做”,而是因为“将做”:如果大数据足够精确,未来我们将失去选择的权利
- 数据独裁:对数据的盲目崇拜,会导致收集数据的不可靠性
掌控,责任与自由并举的信息管理
- 个人隐私保护:从个人许可到数据使用者承担责任
- 个人动机 VS 预测分析:个人有选择自我行为的自由,不就为行为倾向负责
- 击碎黑盒子,大数据算法师的崛起:监督大数据活动,对数据结果进行审查
- 反数据垄断大亨
结语
大数据时代,是名副其实的“信息社会”,以前我们寻找事物发生原因的想法可能被高估了,很多情况下,弄清“是什么”比寻找“为什么”更加重要。
我们尽可能收集数据,不再追求数据的精确性,我们的思维也需要升级。
大数据时代,一切皆可数据化,挖掘数据的价值,发现事务发展的规范,为更好的决策做判断依据
应对大数据时代,个人信息容易被滥用,我们要建立规范制度来保护我们的数据,规范大数据的使用