从大量的数据中发现规律性,提炼出对我们有用的信息;一旦思维转变过来,数据就能被巧妙地用来激发新产品和新型服务。只需要知道是什么,而不需要知道为什么,对现有数据挖掘分析,找出规律,就可以预测未来的某种趋势。
01 更多 不是随机样本,而是全体数据
利用所有的数据,而不再仅仅依靠一小部分数据,大数据不单纯是数据量大,而是一种采用所有数据的分析方法。
02 更杂 不是精确性,而是混杂性
包含了更多的数据,而它不仅能抵消掉错误数据造成的影响,还能提供更多的额外价值。要想获得大规模数据带来的好处,混乱应该是一种标准途径,而不应该是竭力避免的。相比依赖于小数据和精确性的时代,大数据因为更强调数据的完整性和混杂性,帮助我们进一步接近事实的真相。
03 更好 不是因果关系,而是相关关系
大数据的相关关系分析法更准确、更快,而且不易受偏见的影响。建立在相关关系分析法基础上的预测是大数据的核心。相关关系通过识别有用的关联物来帮助我们分析一个现象,而不是通过揭示其内部的运作机制。通过找出一个关联物并监控它,我们就能预测未来。相关关系很有用,不仅仅是因为它能为我们提供新的视角,而且提供的视角都很清晰。而我们一旦把因果关系考虑进来,这些视角就有可能被蒙蔽掉。
04 数据化 一切皆可“量化”
数据化是指一种把现象转变为可制表分析的量化形式的过程;数字化指的是把模拟数据转换成用0和1表示的二进制码,这样电脑就可以处理这些数据了。计量和记录一起促成了数据的诞生,它们是数据化最早的根基。当文字变成数据,它就大显神通了——人可以用之阅读,机器也可用之分析。“现实挖掘”这里指的是通过处理大量来自手机的数据,发现和预测人类行为。有了大数据的帮助,我们不会再将世界看作是一连串我们认为或是自然或是社会现象的事件,我们会意识到本质上世界是由信息构成的。
05 价值 取之不尽,用之不竭”的数据创新
在大数据时代,所有数据都是有价值的。数据的潜在价值有三种最为常见的释放方式:基本再利用、数据集整合和寻找“一份钱两份货”。随着大数据的出现,数据的总和比部分更有价值。当我们将多个数据集的总和重组在一起时,重组总和本身的价值也比单个总和更大。数据是一个平台”,因为数据是新产品和新商业模式的基石。
06 角色定位 数据、技术与思维的三足鼎立
如果你想成功,你不应该成为一个普通的、可被随意替代的人,你应该成为稀缺的、不可替代的那类人。数据非常之多而且具有战略重要性,但是真正缺少的是从数据中提取价值的能力。
数据、技术(有挖掘数据的价值的能力)、大数据思维(不考虑可行性)是一种意识,公开的数据一旦处理得当就能为上千百万人急需解决的问题提供答案。
07 风险 让数据主宰一切的隐忧
大数据的价值不再单纯来源于它的基本用途,而更多源于它的二次利用。大数据时代,很多数据在收集的时候并无意用作其他用途,而最终却产生了很多创新性的用途。人们不是因为所做而受到惩罚,而是因为将做,即使他们事实上并没有犯罪。大数据预测可以为我们打造一个更安全、更高效的社会,但是却否定了我们之所以为人的重要组成部分——自由选择的能力和行为责任自负。随着越来越多的事物被数据化,决策者和商人所做的第一件事就是得到更多的数据。只要得到了合理的利用,而不单纯只是为了“数据”而“数据”,大数据就会变成强大的武器。
08 掌控 责任与自由并举的信息管理
故意将数据模糊处理,促使对大数据库的查询不能显示精确的结果,而只有相近的结果,这就使得挖出特定个人与特定数据点的联系变得难以实现并且耗费巨大。个人隐私保护,从个人许可到让数据使用者承担责任;个人可以并应该为他的行为而非倾向负责。大数据并不是一个充斥着算法和机器的冰冷世界,人类的作用依然无法被完全替代。大数据为我们提供的不是最终答案,只是参考答案,帮助是暂时的,而更好的方法和答案还在不久的未来。
读完之后对我的触动还是蛮大的,最近也在学习相关的课程,结合起来理解会更深入一些。 总之,我们要充分利用数据的价值,但不要盲目迷信大数据的全部,它只是为我们提供一种参考答案而不是最终答案,毕竟数据是死的,人是活的。