在小数据世界中,相关关系也是有用的,但在大数据的背景下,相关关系大放异彩。通过应用相关关系,我们可以比以前更容易、更快捷、更清楚地分析事物。
通过给我们找到一个现象的良好的关联物,相关关系可以帮助我们捕捉现象和预测未来。如果A和B经常在一起发生,我们只需要注意到B发生了,就可以预测A也将要发生了。这个有助于我们捕捉可能和A一起发生的事物,即使我们不能直接测量或者观察到A。当然,相关关系无法预知未来,他们只能预测可能发生的事情,但是已经极其珍贵了。
如:某大型保险公司,他们想利用信用报告和顾客市场分析数据来作为部分申请人的血液和尿液分析的关联物。这些分析结果被用来找出更有可能患高血压、糖尿病和抑郁症的人。其中用来分析的数据包括好几百种生活方式的数据,比如,爱好、常浏览的网站、常看的节目、收入估计等等。这样做的好处就是,申请者不再需要提供血液和尿液样本,仅仅是利用相关关系而得出结论。(虽然我这里也觉得不太可能理解这样做)