2022-01-12

1.贝叶斯网络

1.1 链式法则

P(x_1,x_2,\cdots,x_n) = \prod_{i=1}^n P(x_i|x_1,x_2 \cdots x_{i-1})

举例:P(x_1,x_2,x_3,x_4) = P(x_1)*P(x_2|x_1)*P(x_3|x_1,x_2)*P(x_4|x_1,x_2,x_3) \tag1
推导过程:
\begin{align} P(x_1,x_2,x_3,x_4) &= P(x_4|x_1,x_2,x_3) * P(x_1,x_2,x_3) \tag2 \\ P(x_1,x_2,x_3,x_4) &= P(x_4|x_1,x_2,x_3) * P(x_1,x_2,x_3) \tag3 \\ P(x_1,x_2,x_3) &= P(x_3|x_1,x_2) * P(x_1,x_2) \tag4 \\ P(x_1,x_2) &= P(x_2|x_1) * P(x_1) \tag5 \end{align}

公式5是常见的贝叶斯公式
x_1,x_2,x_3,x_4符合下图关系,x_4仅依赖于x_3,那么在公式1中P(x_4|x_1,x_2,x_3)可以改写成P(x_4|x_3),这样需要算的参数数量会减少

image.png

x_1,x_2,x_3,x_4符合下图关系,x_2不再以x_1为条件,那么在公式1中P(x_2|x_1)可以改写成P(x_2);同样的x_2不再是x_3的父节点,P(x_3|x_1,x_2)可以改写成P(x_3|x_2)

image.png

1.2 有向图因式分解公式

P(x_1,x_2,\cdots,x_n) = \prod_{i=1}^n P(x_i|x_{pa_i})
1.chain模式
证明在给定x_2(即block x_1x_3之间的通路)的条件下,x_1x_3独立,即x_1 \bot x_3 |x_2
根据有向图因式分解公式:P(x_1,x_2,x_3) = P(x_1)*P(x_2|x_1)*P(x_3|x_2)
根据链式公式:P(x_1,x_2,x_3) = P(x_1,x_3|x_2)*P(x_2)
得出: P(x_1,x_3|x_2) = \frac {P(x_1)*P(x_2|x_1)*P(x_3|x_2)}{P(x_2)} = P(x_1|x_2)*P(x_3|x_2)
所以得到x_1x_3独立

image.png

2.Diverge模式
证明在给定x_2(即block x_1x_3之间的通路)的条件下,x_1x_3独立,即x_1 \bot x_3 |x_2
根据有向图因式分解公式:P(x_1,x_2,x_3) = P(x_2)*P(x_1|x_2 )*P(x_3|x_2)
根据链式公式:P(x_1,x_2,x_3) = P(x_1,x_3|x_2)*P(x_2)
得出: P(x_1,x_3|x_2) = P(x_1|x_2)*P(x_3|x_2)
image.png

3.Converge/Collider模式
x_1x_3独立(即x_2block了x_1x_3之间的通路),但在给定x_2的条件下,x_1x_3不独立:
证明:
根据有向图因式分解公式:P(x_1,x_2,x_3) = P(x_1)*P(x_3)*P(x_2|x_1,x_3 )
根据链式公式:P(x_1,x_2,x_3) = P(x_2|x_1,x_3)*P(x_1,x_3)
得出: P(x_1,x_3)= P(x_1)*P(x_3)
另外一种证明方法:
P(x_1,x_3)= \sum_{x_2} P(x_1,x_2,x_3)
     = \sum_{x_2} P(x_1)*P(x_3)*P(x_2|x_1,x_3 )
     = P(x_1)*P(x_3)*\sum_{x_2} P(x_2|x_1,x_3 )
     = P(x_1)*P(x_3)

image.png

D-Separation
D-Separation是一种用来判断变量是否条件独立的图形化方法。换言之,对于一个DAG(有向无环图)E,D-Separation方法可以快速的判断出两个节点之间是否是条件独立的。
如果A,B,C是三个集合(可以是单独的节点或者是节点的集合),为了判断 A 和 B 是否是 C 条件独立的, 我们考虑 E 中所有 A 和 B 之间的无向路径 。对于其中的一条路径,如果满足以下两个条件中的任意一条,则称这条路径是阻塞(block)
(1)路径中存在某个节点 X 是Chain或者Diverge节点,并且 X 是包含在 C 中的;
(2)路径中存在某个节点 X 是Converge节点,并且 X 或 X 的儿子是不包含在 C 中的;
如果 A,B 间所有的路径都是阻塞的,那么 A,B 就是关于 C 条件独立的;否则, A,B 不是关于 C 条件独立的。

例子

image.png

判断图中a与b是否在c条件下独立?
判断 a 和 b 是否是 c下条件独立的: a 到 b 只有一条路径 a->e->f->b 。 考虑路径上的点 e 和 f :其中e 是Converge类型的,且 e 的儿子节点就是 c ,根据条件2,e不阻断。而节点f是Diverge类型节点,根据条件1,f不在c中,所以也有a,b不是c条件下独立。

判断图中a与b是否在f条件下独立?
判断 a 和 b 是否是 f 下条件独立的:路径 a->e->f->b 上的所有节点。考虑路径上的点e和f:节点 e 是Converge类型的,e 和她的儿子节点 c 都不在 f 中,所以根据条件2,e是阻断路径的节点。节点 f 是Diverge类型节点,且 f 节点就在 f中,所以 f 节点阻断了路径。 结论:a 和 b是 f 下条件独立的。

2.后门调整准则

2.1 干预 / do算子

image.png

定义:将因果图中结点X值修改为x,记为do(X = x ),可以简写为do(x )
性质:在对结点X进行干预时,会删除因果图中指向X的边,干预节点的概率为1,其他的节点概率保持不变;
image.png

与“以变量为条件”(conditioning)的区别

  • 表现形式:P(Y = y ∣ X = x ) vs P(Y=y | do(X=x))
  • “以变量为条件”是选取观测到T=1的样本子集,“干预”是让所有样本T=1
  • “以变量为条件”不改变原始数据的分布,“干预”改变了原始数据的分布
2.2 截断式因式分解(Truncated Factorization)

image.png

根据有向图因式分解公式:P(y,t,x) = P(x)*P(t|x)*P(y|t,x)
根据截断式的性质,P(t|x)=1,所以:P(y,x|do(t)) = P(y|t,x)*P(x)
边际化xP(y|do(t)) = \sum_x P(y|t,x)*P(x)

P(y|t,x)*P(x|t) =\frac {P(y|t,x)*P(x|t)*P(t)}{P(t)}=\frac {P(y,t,x)}{P(t)}=\frac {P(y,x|t)*P(t)}{P(t)}=P(y,x|t)
\sum_x P(y|t,x)*P(x|t) = \sum_x P(y,x|t) = P(y|t)
P(y|t)P(y|do(t))的区别在与一个是乘以P(x|t),一个是乘以P(x)P(y|t)表示相关性,P(y|do(t))表示因果性,由于confounder X的存在,相关性\neq因果性
如果切断xt之间的联系,那么P(x) = P(x|t)

2.3 后门调整(Backdoor Adjustment)

和2.2节同样的DAG图,推导后门调整公式:
\begin{align} P(y|do(t)) &= \sum_x P(y|do(t),x)*P(x|do(t)) \\ &= \sum_x P(y|t,x)*P(x|do(t)) \\ &= \sum_x P(y|t,x)*P(x) \end{align}
第1个等号:
\begin{align} \sum_x P(y|do(t),x)*P(x|do(t)) & = \sum_x \frac{P(y|do(t),x)*P(x|do(t))*P(do(t))}{P(do(t))} \\ &= \sum_x \frac{P(y,do(t),x)}{P(do(t))} \\ &= \sum_x \frac{P(y,x|do(t))*P(do(t))}{P(do(t))} \\ &=\sum_x P(y,x|do(t)) = P(y|do(t)) \end{align}
第2个等号:because y blocks all backdoor paths from t to y, the only association flowing from t to y is causal association. so we can remove do(t) in the factor for y
第3个等号: 简单理解就是根据后门准则,给定了x,切断了t \rightarrow x \rightarrow y这条路,使得只有t \rightarrow y这一条路,而这条路是我们想获得的causal association.
消除do(t)是因为:1.do(t)切断了T的parents,没有in-edge association流向 T \rightarrow W; 2. 如果存在association则为T 的 out-edge association,则会与Y形成一个collider,association 被 collider 切断。所以T与W独立下面举个例子,

image.png

切断C \rightarrow T的连接,C,T,Y形成collider,由于Y未观测,C和T独立
because we're intervening on t,there are no incoming edges to t, so no association can flow from t to x through backdoor paths,so the only way that association could flow from t to x,is through paths that are directed out of t,not backdoor paths and this is where the second part of the backdoor criterion come into play, we cannot have any association from t to w, that's directed out of f because it will run into colliders, so in this
另一种证明方法
这种证明的方法一个重点是P_m分布和P一样了???
image.png

参考资料

链式法则&有向图因式分解公式
d-separation
后门调整参考1
后门调整参考2

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容