笔记#6因果关系是什么?

当我们在问「为什么」的时候,我们在问什么? 因果(causality)非常难以定义

一、因果关系与相关关系(基于统计模型)

错误理解:因果就是「经常性联结」(constant conjunction)。如果我们观察到,A总是在B之前发生,事件A与事件B始终联结在一起,那么A就导致了B,或者说A是B的原因。( 大卫·休谟)------实际上是皮尔森定义的“相关性”

反驳:对比思考。

观察到(统计模型):老板喜欢打麻将---》企业发生违约,那么对于相同的样本,也会观察到:企业发生违约---》老板喜欢打麻将  (也许两件事共同的原因只是生意不佳)

因为,相关性是对称的【corr(x,y)=corr(y,x)】,而因果关系不是对称的

这样的单个模型可以同时描述多种不同的因果、甚至非因果的关系。

那么什么是因果的顺序性(不对称)?

A和B是某种事件,而且A必须发生在B之前。因为「因」必须发生在「果」之前,所以如果A导致了B,那么不可能同时有B导致了A——两个事件无法互为因果。

二、随机对照试验

基于观测的统计模型无法可靠地识别因果关系。要确定因果关系,必须通过随机对照试验(Randomized Controlled Trial)

1、 试验对象(用u表示)会被随机分入两组:实验组(用t表示)和对照组(用c表示),实验组和对照组采用随机或配对方式尽量同分布

2、 实验组的对象会接受干预,但对照组的对象不会受到任何干预/介入

3、用以下符号表示随机对照试验的结果:

Yc(u)是在对照组条件下,对象u展现出的结果变量Y

* Yt(u)是在实验组条件下,对象u展现出的结果变量Y

4、  Yt(u)是否统计显著地不同于  Yc(u)?

那么: t与c的区别是因果关系中的「因」,  Yt(u)与  Yc(u)的区别是因果关系中的「果」

三、介入主义(interventionism)因果观

在随机对照实验的基础框架上,建立介入主义(interventionism)因果观。

一个介入主义的因果模型包括三部分:

1. 所有的系统 U :一个包含所有系统 u 的集合。一个系统 u 我们讨论的对象,可以是人体、机械、星球、化学反应系统、经济实体等。

2. 所有的介入方式 T:一个包含所有可能的介入方式 t的集合。

3. 状态函数 Y:输入一个系统 u和一种介入方式 t,输出系统的某个状态 y ,写作 y=Yt(u) 。

例如,在一组对照中, Y可以反映「u(A地某行业企业)在受到t(本地行业政策)之后的y(违约率)」。

(y不一定要完整描述u的状态的所有部分,只反映几个变量也是可以的。在建立因果模型时,具体问题具体分析,选择一个合适的状态函数。)

那么,Yc(u)则表示,「u(A地某行业企业)在受到c(未受到本地行业政策影响)之后的y(违约率)」 (理想情况是取相同时点,由于政策豁免等原因未受影响的企业)

综上:

1、任意一个介入主义的因果模型,都必须明确指出一种代表「不介入」的介入方式。

2、当我们在问「为什么发生了现象 y1」的时候,我们其实在问:「在我对世界建立的因果模型中,自然状态的现象是  y0=Yc(u),但是我观察到了现象 y1<>(不等于)y0 。于是,我认为实际发生的情况是  y1=Yt(u),其中 t<>c 。 t与 c之间的区别是什么?」

注意:区别于 格兰杰因果(Granger causality)格兰杰因果的定义:如果得知事件A的发生有助于预测之后的事件B,那么我们说A是B的格兰杰因。然而,格兰杰因果只包含了观测,却没有包含介入。

疑问:观察和介入,有什么本质区别吗?

一个日常例子式的回答如下:

用A代表「环境温度」,用B代表「温度计读数」,A与B之间的因果关系为 A--》B 。在默认状态下,温度计不会受到外在干预。因此,观察到温度计读数升高,我们可以推断出环境温度升高。但是,当我们直接干预温度计时(例如用手握住温度计),我们进行了介入  do(B=b1),使温度计的读数变成了 b1 ;同时,因为是介入而非观察,从A到B的因果箭头被切断了 。

假设 b1是一个较高的温度,那么:

1、  P(A=b1|B=b1)代表「在自然状态下,观察到温度计的读数是 b1时,实际的环境温度为 b1的概率」;

2、P(A=b1|do(B=b1)) 代表「在外在干预使温度计读数成为 b1 时,实际的环境温度为 b1的概率」。

显然,  P(A=b1|B=b1)>P(A=b1|do(B=b1)) ,可见观察与介入是两种完全不同的行为。观察不会影响模型的自然状态,但介入会。

About 《Causality》(Judea Pearl)和光瑜的人工智能笔记

图片发自简书App
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,793评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,567评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,342评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,825评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,814评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,680评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,033评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,687评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 42,175评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,668评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,775评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,419评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,020评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,206评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,092评论 2 351
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,510评论 2 343

推荐阅读更多精彩内容

  • 专业考题类型管理运行工作负责人一般作业考题内容选项A选项B选项C选项D选项E选项F正确答案 变电单选GYSZ本规程...
    小白兔去钓鱼阅读 8,970评论 0 13
  • 高级钳工应知鉴定题库(858题) ***单选题*** 1. 000003难易程度:较难知识范围:相关4 01答案:...
    开源时代阅读 5,687评论 1 9
  • 选择题部分 1.(),只有在发生短路事故时或者在负荷电流较大时,变流器中才会有足够的二次电流作为继电保护跳闸之用。...
    skystarwuwei阅读 12,738评论 0 7
  • "use strict";function _classCallCheck(e,t){if(!(e instanc...
    久些阅读 2,027评论 0 2
  • 在C语言中,五种基本数据类型存储空间长度的排列顺序是: A)char B)char=int<=float C)ch...
    夏天再来阅读 3,323评论 0 2