第一部分 大数据时代的思维变革
01|更多:不是随机样本,而是全体数据
02|更杂:不是精确性,而是混杂性
03|更好:不是因果关系,而是相关关系
第二部分 大数据时代的商业变革
04|数据化:一切解渴“量化”
Case1【亚马逊】
- GregLinden 最初内容是由人工亲自完成
- JessBezos 根据客户个人以前的购物喜好,为其推荐具体的书籍
(✖️)信息量大,因此用传统方法处理,通过样本分析找到客户间的相似性。
(✔️)应寻找产品之间的关联性
- 1998Linden和同事申请了“item-to-item”协同过滤技术的专利
- 估算可以提前进行
- 数据推荐产品销量>书评家
- 数据没有说话,人工评论的成本非常高
Case2【奈飞】
- “是什么”可以创造点击率
- 是什么让客户做出选择
- 把握客户做决定背后的真正原因
关联物,预测的关键
- 应用相关关系,比以前更容易、更快捷、更清楚地分析事物。
- 相关关系的核心是量化两个数据值之间的数理关系。
- 相关关系通过识别有用的关联物来分析一个现象,而不是通过揭示其内部的运作机制。
- 相关关系没有绝对,只有可能性。
- 相关关系可以帮助捕捉现在和预测未来,无法预知未来,只能预测可能发生的事情。
Case3【沃尔玛】
1990' 沃尔玛让供应商自行管理物流、不接受产品的“所有权”(避免存货的风险也降低成本)。
2004 飓风来临,手电筒、蛋挞销量增加——应放在一起,增加销量
- 当数据点以数量级方式增长的时候,会观察到许多似是而非的相关关系。
- 1888年FrancisGalton提出:在大数据时代来临前很久,相关关系就已经被证明大有用途。
- how to find the connection?——有些人会使用建立在理论基础上的假象来指导自己选择适当的关联物。(只是用小数据时代)
- 用数据驱动的关于大数据的相关关系分析法,取代了基于假象的易出错的方法
- 大数据的核心:建立在相关关系分析发基础上的预测是