关于因果关系

人类祖先想象不存在之物的能力是一切的关键，正是这种能力让他们得以交流得更加顺畅。-瓦尔·赫拉利《人类简史》

数据远非万能。数据可以告诉你服药的病人比不服药的病人康复得更快，却不能告诉你原因何在。也许，那些服药的人选择吃这种药只是因为他们支付得起，即使不服用这种药，他们照样能恢复得这么快。

在科学和商业领域，仅凭数据不足以解决问题的情况一再发生。尽管或多或少地意识到了其局限所在，但多数热衷于大数据的人仍然选择盲目地继续追捧以数据为中心的问题解决方式，仿佛我们仍活在因果禁令时代。

关于许多领导者习惯只依靠数据做决定的弊端，大家可以回看这篇文章《一年读多少本书才算读书呢》。

当我们感兴趣的科学问题设计反思性的思考时，我们通常会诉诸另一种类型的表达形式，这种表达形式是因果推断科学独有的，我们称之为“反事实”（counterfactual）。

反事实推理涉及假设分析（what-ifs），这可能会使一些读者朋友质疑其科学性。事实上，经验观察永远无法证实或反驳这些问题的答案。然而，人类一直在对哪些事可能发生或哪些事可能已经发生做出极可靠的、可重复的判断。

例如，我们都明白，即使某天早晨公鸡没有打鸣，太阳也会照常升起。这一共识源于这样一个事实：反事实并非异想天开之物，而是反映了现实世界运行模式的特有结构。共享同一因果模型的两个人也将共享所有的反事实判断。

今天我们来聊聊因果关系科学的认知能力。

三个层级

因果关系有不同层级的认知能力，这三种层级的能力是需要熟练掌握的：观察能力（seeing）、行动能力（doing）、想象能力（imagining）。

第一层级，观察能力（seeing）

具体是指发现环境中的规律的能力。在认知革命发生之前，这种能力为许多动物和早期人类所共有。

处于第一层级的是关联。如果观察到某一事件改变了观察到另一事件的可能性，我们便说这一事件与另一件事件相关联。

因果关系之梯的第一层级要求我们基于被动观察做出预测。典型问题是：“如果我观察到......会怎样？”

第二层级，行动能力（doing）

涉及预测对环境进行刻意改变后的结果，并根据预测结果选择行为方案以催生出自己期待的结果。处于第二层级的是干预。

只有少数动物表现出了具备此种能力的特征。对工具的使用（前提是使用是有意图的，而不是偶然的或模仿前人）就可以视作达到第二层级的标志。

因果关系之梯第二层级的典型的问题是：“如果我们实施......行动，将会怎样？”

第三层级，想象能力（imagining）

如果第一层级对应的是观察到的世界，第二层级对应的是一个可被观察的美好新世界，那么第三层级对应的就是一个无法被观察的世界（因为它与我们观察到的世界截然相反）。

因果关系之梯第三层级的典型问题是：“假如我当时做了......会怎样？”和“为什么？” 两者都涉及观察到的世界与反事实世界的比较。

层级关系

我们举个例子，继续用卖场中“啤酒与尿布”的故事吧，《一年读多少本书才算读书呢》详细阐述过这个故事的背景，这里不再详述故事本身，只来说说认知层级与层级之间的关系。

销售经理可能会问：“购买尿布的顾客同时购买啤酒的可能性有多大？”

此类问题正是统计学的安身立命之本，统计学家主要通过收集和分析数据给出答案。

这个问题我们可以这样解决：首先，采集所有顾客购物行为的数据，然后筛选出购买尿布的顾客，计算他们当中购买啤酒的人数比例。这个比例被称之为“条件概率”，用于预测（针对大数据）“买尿布”和“买啤酒”两种行为之间的关联程度。

1，关联

有些关联可能有明显的因果解释，有些可能没有。但无论如何，统计学本身并不能告诉我们，尿布或啤酒哪个是因，哪个是果。从销售经理的角度看，这件事也许并不重要——好的预测无须好的解释。

当我们开始改变世界的时候，我们就迈上了因果关系之梯的更高一层台阶。

这一层级的一个典型问题是：“如果我们把尿布的价格翻倍，啤酒的销售额会怎么样？”这类问题处于因果关系之梯的第二层级，提出及回答这类问题要求我们掌握一种脱离于数据的新知识，即干预。

2，干预

干预比关联更高级，因为它不仅涉及被动观察，还涉及主动改变现状。

无论数据集有多大或者神经网络有多深，只要使用的是被动收集的数据，我们就无法回答有关干预的问题。从统计学中学到的任何方法都不足以让我们明确表述类似“如果价格翻倍将会发生什么”这样简单的问题，更别说回答它们了。

为什么我们不能仅通过观察来回答啤酒的问题呢？为什么不直接进入有历史购买记录的庞大数据库，看看在尿布价格翻倍的情况下实际发生了什么呢？原因在于，在以往的情况中，涨价可能出于完全不同的原因，例如产品供不应求，其他卖场也不得不涨价的情况。

现在，我们并不关注市场行情如何，只想通过刻意干预为牙膏设定新的价格，因而带来的结果就可能与此前顾客在别处买不到便宜牙膏时的购买行为大相径庭。

预测干预结果的一种非常直接的方法是在严格控制的条件下进行试验。

像脸书这样的大数据公司深知实验的力量，他们在实践中不断地进行各种实验，比如考察页面上的商品排序不同或者给用户设置不同的付款期限（甚至不同的价格）会导致用户行为发生怎样的改变。

关于脸书利用大数据干预用户行为，而涉及隐私及道德的事件时有发生，其中很严重的一起事件，我们之前的文章《不要让自己过的太舒服，因为很危险》也提到过。

Facebook在一项涉及近70万名用户的“秘密且非自愿的”研究中，通过改变用户信息流的方式，“故意扰乱人们的思想”，而得到指控。

研究发现，当Facebook减少贴出用户友好的「感觉良好内容」时，用户自己的「正面发帖」亦减少；而当减少在Newsfeed贴出朋友的「负面内容」时，用户的「负面发帖」亦随之减少。

实验的结论为：社交网络上用户友人圈子的感受，会影响自身的情绪及对事件的认知。

一个足够强大的、准确的因果模型可以让我们利用第一层级（关联）的数据来回答第二层级（干预）的问题。

没有因果模型，我们就不能从第一层级登上第二层级。这就是深度学习系统（只要它们只使用了第一层级的数据而没有利用因果模型）永远无法回答干预问题的原图，干预行动据其本意就是要打破机器训练的环境规则。

3，反事实

虽然关于干预的推理是因果关系之梯中的一个重要步骤，但它仍不能回答所有我们感兴趣的问题。

反事实与数据之间存在着一种特别棘手的关系，因为数据顾名思义就是事实。数据无法告诉我们在反事实或虚构的世界里会发生什么，在反事实世界里，观察到的事实被直截了当地否定了。

然而，人类的思维却能可靠地、重复地进行这种寻求背后解释的推断。这种能力彻底地区分了人类智能与动物智能，以及人类与模型盲版本的人工智能和机器学习。

我们可能会怀疑，对于“假如”（would haves）这种并不存在的世界和并未发生的事情，科学能否给出有效的陈述。科学确实能这么做，而且一直就是这么做的。

那么第三层级的问题来了：“假如我们把尿布的价格提高一倍，则之前买了啤酒的顾客仍然选择购买的概率是多少？”

这回，我们所做的就是将真实的世界（在真实的世界，我们知道顾客以当前的价格购买了尿布）和虚构的世界（在虚构的世界，尿布价格是当前的2倍）进行对比。

如果模型可用于回答此类反事实问题，建构因果模型所带来的回报是巨大的：找出犯错的原因，我们之后就能采取正确的改进措施；找出一种疗法对某些人有效而对其他人无效的原因，我们就能据此开发出一种全新的疗法；“假如当时发生的事情与实际不同，那会怎样?"

对这个问题的回答，让我们得以从历史和他人的经验中获取经验教训，这是其他物种无法做到的。

将反事实置于因果关系之梯的顶层，它已经充分表明了朱迪亚·珀尔将其视为人类意识进化过程中的关键时刻。正如《人类简史》作者尤瓦尔·赫拉利的观点：“对虚构创造物的描述是一种新能力的体现，这种新能力的出现为认知革命。”

总结

为什么“关于因果关系”这篇文章要紧跟着上篇《关于基因，我们还需要知道这些》来写，是因为文章中出现了“概率事件”和“个体事件”的冲突，也就是“统计学”和“因果关系科学”之间的冲突，变量永远是一个不可控的因素。

就像研究星座的人知道的那样，即使两个人的星座（太阳星座和月亮星座）一模一样，这两个人的性格可能也截然不同，因为有太多其他的变量因素在里面。充其量只能是个概率事件，不能算个体事件。

很喜欢朱迪亚·珀尔的这段话：

“我热衷于关注哲学家对诸如因果关系、归纳法和科学推断逻辑等模糊概念的讨论。哲学家的优势在于能够从激烈的科学辩论和数学处理方面的现实困扰中解脱出来。相比其他领域的科学家，他们受统计学反因果偏见的毒害较少。

他们有条件呼吁因果关系这一传统思想的复归，这种思想至少可以追溯到亚里士多德时代。谈起因果关系，他们也用不着不好意思，或者躲在’关联‘标签的背后。”

-THE END-