精要
大数据有一个关键概念,就是从因果关系转向相关关系。它并不知道中间的过程,但是只要两个现象之间总是能够有相关性,它就能够做出一个预测。
以农谚为例,实际它背后有一套因果关系。蚂蚁搬家是因为蚂蚁很敏感,它们能感受到空气湿度的增加,也就是说它不需要晴雨表,就能够通过对空气湿度的敏锐的感知而知道马上要下雨,所以它们要把家从低处搬到高处去。燕子低飞是因为那些昆虫由于湿气增加,翅膀变得潮湿,以至于没办法飞得很高,燕子是以它们为食,所以昆虫低飞导致燕子也低飞了。
农民通过长期的观察,并不一定要知道他们之间的因果关系,但他们可以认定,当蚂蚁搬家,燕子低飞的时候,就会下雨。
今天人类进入了一个一切人和事的运行都可以被实时的记录下来,变成数据。通过对数据的挖掘和分析,人类就获得了一种前所未有的能力,通过分析现象间的关联,达到预测未来的目的。但是,这并不意味着人类就能够消除不确定性。
不管大数据技术如何的发达,人类都没办法穷尽这个世界的不确定性,模糊性,易变性和复杂性。100年前就有海森堡的测不准原理,揭示了物理世界的不确定性,而人类世界里的不确定性,就更加的明显了:每一个人的行为,每一个人的思维都有很多很多的偶然性,当无数个充满着不确定性偶然性的个体汇聚在一起的时候,我们通过大数据技术是可以做出某种预知的,但是还有大量的事件,大量的过程是无法预测的。
一命二運三風水四積陰德五讀書。虽然这个话带有不科学甚至迷信色彩,但是它也在提醒我们这个世界是充满着不确定性的,我们能做的就是一句话,尽人事听天命。
大数据,今天我们可以把它叫人算,它是力图接近天算的那种人算,但它毕竟是,人算不如天算。
心得
利用大数据做预测,能达到60%以上的准确率,就已经比完全不确定好很多了。