当我们在问「为什么」的时候,我们在问什么? 因果(causality)非常难以定义
一、因果关系与相关关系(基于统计模型)
错误理解:因果就是「经常性联结」(constant conjunction)。如果我们观察到,A总是在B之前发生,事件A与事件B始终联结在一起,那么A就导致了B,或者说A是B的原因。( 大卫·休谟)------实际上是皮尔森定义的“相关性”
反驳:对比思考。
观察到(统计模型):老板喜欢打麻将---》企业发生违约,那么对于相同的样本,也会观察到:企业发生违约---》老板喜欢打麻将 (也许两件事共同的原因只是生意不佳)
因为,相关性是对称的【corr(x,y)=corr(y,x)】,而因果关系不是对称的
这样的单个模型可以同时描述多种不同的因果、甚至非因果的关系。
那么什么是因果的顺序性(不对称)?
A和B是某种事件,而且A必须发生在B之前。因为「因」必须发生在「果」之前,所以如果A导致了B,那么不可能同时有B导致了A——两个事件无法互为因果。
二、随机对照试验
基于观测的统计模型无法可靠地识别因果关系。要确定因果关系,必须通过随机对照试验(Randomized Controlled Trial)
1、 试验对象(用u表示)会被随机分入两组:实验组(用t表示)和对照组(用c表示),实验组和对照组采用随机或配对方式尽量同分布
2、 实验组的对象会接受干预,但对照组的对象不会受到任何干预/介入
3、用以下符号表示随机对照试验的结果:
Yc(u)是在对照组条件下,对象u展现出的结果变量Y
* Yt(u)是在实验组条件下,对象u展现出的结果变量Y
4、 Yt(u)是否统计显著地不同于 Yc(u)?
那么: t与c的区别是因果关系中的「因」, Yt(u)与 Yc(u)的区别是因果关系中的「果」
三、介入主义(interventionism)因果观
在随机对照实验的基础框架上,建立介入主义(interventionism)因果观。
一个介入主义的因果模型包括三部分:
1. 所有的系统 U :一个包含所有系统 u 的集合。一个系统 u 我们讨论的对象,可以是人体、机械、星球、化学反应系统、经济实体等。
2. 所有的介入方式 T:一个包含所有可能的介入方式 t的集合。
3. 状态函数 Y:输入一个系统 u和一种介入方式 t,输出系统的某个状态 y ,写作 y=Yt(u) 。
例如,在一组对照中, Y可以反映「u(A地某行业企业)在受到t(本地行业政策)之后的y(违约率)」。
(y不一定要完整描述u的状态的所有部分,只反映几个变量也是可以的。在建立因果模型时,具体问题具体分析,选择一个合适的状态函数。)
那么,Yc(u)则表示,「u(A地某行业企业)在受到c(未受到本地行业政策影响)之后的y(违约率)」 (理想情况是取相同时点,由于政策豁免等原因未受影响的企业)
综上:
1、任意一个介入主义的因果模型,都必须明确指出一种代表「不介入」的介入方式。
2、当我们在问「为什么发生了现象 y1」的时候,我们其实在问:「在我对世界建立的因果模型中,自然状态的现象是 y0=Yc(u),但是我观察到了现象 y1<>(不等于)y0 。于是,我认为实际发生的情况是 y1=Yt(u),其中 t<>c 。 t与 c之间的区别是什么?」
注意:区别于 格兰杰因果(Granger causality)格兰杰因果的定义:如果得知事件A的发生有助于预测之后的事件B,那么我们说A是B的格兰杰因。然而,格兰杰因果只包含了观测,却没有包含介入。
疑问:观察和介入,有什么本质区别吗?
一个日常例子式的回答如下:
用A代表「环境温度」,用B代表「温度计读数」,A与B之间的因果关系为 A--》B 。在默认状态下,温度计不会受到外在干预。因此,观察到温度计读数升高,我们可以推断出环境温度升高。但是,当我们直接干预温度计时(例如用手握住温度计),我们进行了介入 do(B=b1),使温度计的读数变成了 b1 ;同时,因为是介入而非观察,从A到B的因果箭头被切断了 。
假设 b1是一个较高的温度,那么:
1、 P(A=b1|B=b1)代表「在自然状态下,观察到温度计的读数是 b1时,实际的环境温度为 b1的概率」;
2、P(A=b1|do(B=b1)) 代表「在外在干预使温度计读数成为 b1 时,实际的环境温度为 b1的概率」。
显然, P(A=b1|B=b1)>P(A=b1|do(B=b1)) ,可见观察与介入是两种完全不同的行为。观察不会影响模型的自然状态,但介入会。
About 《Causality》(Judea Pearl)和光瑜的人工智能笔记