数据分析和讲故事有什么关系?
讲故事对于人类而言非常重要。根据尤瓦尔 赫拉利在《人类简史》中的描述,大概7万年,因为某种基因突变,智人产生了认知革命,他们拥有了其他人种所不具备的语言能力,尤其是可以描述虚构事物的能力,即讲故事的能力,这种能力能够让智人超越血缘关系和族群的局限,开展合作,形成更大的力量。这种力量如此巨大,导致认知革命发生的短短数万年间,智人已经成为地球的统治者。自从认知革命以后,智人就能够依据不断变化的需求通过虚构的故事迅速调整行为。这就等于开启了一条采用“文化演变”的快速通道,战胜那些仅仅依靠“基因演化”的其他人类和动物是显而易见的。
根据《快思考 慢思考》卡尼曼的研究,从大脑的结构来看,存在着模式1和模式2,模式1决策速度快,耗能少,简单粗糙,不进行严密推理,代表感性,模式2决策速度慢,耗能多,细致严密,代表理性。在资源极度匮乏的原始社会,人类倾向于更多用模式1来决策,这样规避危险效果好,但是带来的弊端是人往往过渡依赖模式1,面对复杂的现实情况,总会无意识的进行简化,降低随机性。这从生存的角度来看,绝大部分的时候是有效的,因为人的大脑中,相对于长期记忆而言,工作记忆区间很小,只能处理4项、至多7项内容,人对信息的获取、储存、处理和提取都需要付出代价,压缩对于意识的正常工作至关重要,所以,简化、寻找“捷径”是符合生存需要,也就固化在基因中了。
那么,如何简化?在《黑天鹅》一书中,作者举了这个例子“国王死了。王后也死了”,“国王死了,王后也死于过度悲伤”,看起来后者信息量更大,但是因为后者有了因果关系,赋予了解释,实质上信息得到了简化,更容易理解和传播。
正如《黑天鹅》书中提到的,解释是有必要的,但是过度解释会导致叙述谬误。叙述缪误指的是我们无法在不编造理由或者强加一种逻辑关系的情况下观察一系列事实。对事实的解释会与事实混在一起,使事实变得更容易被记住,更符合道理。这种倾向的坏处在于它使我们以为对事物有了更好的理解。因为在解释的过程中,人会不自觉的抛弃那些看起来不合情理但是至关重要的随机性,这些随机性被放置一边,真实世界的复杂性降低了,黑天鹅也被我们视而不见了。
如何避免这种情况?《黑天鹅》的作者写到:强调实验而非讲故事,强调体验而非历史,强调客观知识而非理论。另一个方法是预测并记录预测的结果。
我认为,尽可能避免“黑天鹅”的方法是数据分析,尽可能多的收集数据,而且是多维的数据,不预设观点,不强行解释,直接从客观数据中寻找可能的规律,大胆预测,小心实证,尽可能逼近真相,只有这样,才有可能发现黑天鹅的蛛丝马迹。
另外,既然故事这么重要,美国前总统奥巴马一举成名的首次演讲就是以自己的故事开头,那么我们也要充分利用广大群众爱听故事的特点,通过讲好一个故事来推动数据分析的影响。一般而言,网络群众对数据分析结果的兴趣要远远小于一个具体的故事。我们在展示数据分析结果的时候,一定要把它具体化、形象化,如果能够可视化就更好。比较一下欧洲难民数据分析报告和叙利亚三岁男童淹死在土耳其沙滩上的照片,哪个对社会舆论和德国政府的影响更大?
参考资料:
1.《人类简史》尤瓦尔 赫拉利
2.《快思考 慢思考》卡尼曼
3.《黑天鹅》塔勒布
4.得到APP 奥巴马2004年在民主党全国代表大会上的演讲
5.叙利亚3岁小难民伏尸海滩照片震动世界http://mt.sohu.com/20150906/n420479437.shtml