大数据怎么就改变了我们的生活、工作和思维?
《大数据时代》里有两个观点可以解释原因。一:“为什么“的因果关系在欺骗我们。二:知道”是什么“的相关关系才最重要。
“为什么“因果关系在欺骗我们
什么是因果关系?
举个例子:
每年夏天溺水儿童和雪糕的销售数量成正比,但是雪糕销售量和溺水儿童的数量显然不具有因果关系。但是:天气热——雪糕数量增加——溺水儿童数量上升是具有因果关系的。雪糕数量上升和溺水儿童数量之间是相关关系。
上面这个是区别相关关系和因果关系的经典例子。
如果将这个例子转化为现实生活中需要解决的问题。那么从因果关系着手处理到相关关系着手处理的变化就是以前小数据时代到现在大数据时代的变化。
生活中我们去一家餐厅吃饭,吃完饭回来感觉胃有点不舒服。因果关系的思维模式就是:因果关系前置:这家的菜不干净,导致我胃不舒服。解决方法:以后不去这家餐厅吃饭。
但真实的原因可能是空调温度太低、又或者是病毒感染我们并不得而知。因果关系其实并不能成立,但是我们需要有一个解决问题的方法论,因果关系在小数据时代是成本最低也最容易实现的一个解决问题的思维方式。因为单凭经验就可以做出判断。
但在大数据时代,数据的“样本=总体”可以记录有关一件事的所有相关信息,然后综合这些信息就能看到事情的全貌,并可以预测未来的发展。比如现在的智能体重秤、运动手环等,这就属于大数据时代的思维方式,下面会详细说明。
通过上面说的因果关系的案例,就可以发现为什么因果关系在欺骗我们?一来看似简单的事情,引起它的原因却多,我们无法确认具体是什么原因引起的这件事情发生。
我们仍然沿用是因为我们别无他法,但更大的危险在于这种快速解决问题的思维方式日积月累会很快占领我们的全部思维。
这些思维容易让我们形成思维定式,带领我们走入思维的误区。
知道“是什么”的相关关系才重要
上面说到运动手环和体重秤。手环、智能体重秤……这些产品都是在监测我们日常生活,从心跳数据、运动步数、脂肪含量、身体水分含量都有详细的记载。“样本=总体“这是大数据时代的统计特征。通过对数据全面的记录,再通过查看相关数据的变化来把握现实的情况,根据情况解决问题。比如体重秤现实体内水分缺乏,那么接下来就补充水分。它不会告诉你为什么水分缺少,只会显示这样一个事实。同理,汽车的监测系统,通过数据提示你发动机过热、某处螺丝有松动。有这样的数据显示,车主就需要立马给发动机降温。
大数据能迅速反应事情的现实状态,基于现实的状态,我们能预测未来的状况。《大数据时代》里有这样一个例子:美国第二大零售商塔吉特可以运用大数据知道一个女性是否怀孕甚至是会在什么时候怀孕。
一天,一个男人冲进了一家位于明尼阿波利斯市郊的塔吉特商店,要求经理出来见他。他气愤地说:“我女儿还是高中生,你们却给她右击婴儿服和婴儿床的优惠券,你们是在鼓励她怀孕吗?”而当几天后经理打打电话过去道歉的时候,这个男人的语气变得温和起来。他说:“我跟女儿谈过了,她的预产期是8月份,是我完全没有意识到这个事情的发生,应该说抱歉的是我。”
既然相关关系能最快的解决问题,那么因果关系是否就毫无用处?也并不是。前面提到的因果关系会欺骗我们,是因为因果关系太难确定,但现在既然有了大数据,那何不运用大数据来确认原因,从相关性中反推出因果关系,从根本上解决问题。