在今年暑假热播的电视剧《长安十二时辰》中,靖安司利用大案牍术选出了张小敬替他们办案,同时也使用大案牍术来推测各种事情。这个大案牍术听起来非常像古代版的大数据,那么它究竟是不是大数据呢?
大数据在于发现和理解信息内容及信息与信息之间的关系,建立在相关关系分析法基础上的预测是大数据的核心。“大数据”不仅仅指“大”的数据集;它要是具有足够的规模、足够的维度的数据量的数据集,可以基于此数据集进行一些预测、分析及更有价值的信息提取。
预测这件事啊,我们一直都在做。古人通过观天象预测天气,我们通过看天气预报决定明天穿什么衣服。球迷们请章鱼来预测球队的输赢,无数的股民们想知道明天股市的走向会如何。
预测和预测有什么不同吗?有。如果有一个熊孩子在我的正上方高空抛物,扔了一个钢镚下来,我判定这个钢镚会砸我脸上,所以我赶紧躲开了。地球的重力和熊孩子在我正上方扔的钢镚是因,砸我脸上是果,我是基于因果关系来进行预测的。而大数据的预测是基于相关关系进行预测的。通过发现数据之间的关系来进行预测,它不解释,不说明“为什么”,只回答“是什么”。
可见,大案牍术即没有足够体量的数据,也不是利用相关关系进行分析,并不是真的大数据。