1.贝叶斯网络
1.1 链式法则
举例:
推导过程:
公式5是常见的贝叶斯公式
当符合下图关系,
仅依赖于
,那么在公式1中
可以改写成
,这样需要算的参数数量会减少

当符合下图关系,
不再以
为条件,那么在公式1中
可以改写成
;同样的
不再是
的父节点,
可以改写成

1.2 有向图因式分解公式
1.chain模式
证明在给定(即block
到
之间的通路)的条件下,
和
独立,即
:
根据有向图因式分解公式:
根据链式公式:
得出:
所以得到和
独立

2.Diverge模式
证明在给定
根据有向图因式分解公式:
根据链式公式:
得出:

3.Converge/Collider模式
和
独立(即
block了
到
之间的通路),但在给定
的条件下,
和
不独立:
证明:
根据有向图因式分解公式:
根据链式公式:
得出:
另外一种证明方法:

D-Separation
D-Separation是一种用来判断变量是否条件独立的图形化方法。换言之,对于一个DAG(有向无环图)E,D-Separation方法可以快速的判断出两个节点之间是否是条件独立的。
如果A,B,C是三个集合(可以是单独的节点或者是节点的集合),为了判断 A 和 B 是否是 C 条件独立的, 我们考虑 E 中所有 A 和 B 之间的无向路径 。对于其中的一条路径,如果满足以下两个条件中的任意一条,则称这条路径是阻塞(block):
(1)路径中存在某个节点 X 是Chain或者Diverge节点,并且 X 是包含在 C 中的;
(2)路径中存在某个节点 X 是Converge节点,并且 X 或 X 的儿子是不包含在 C 中的;
如果 A,B 间所有的路径都是阻塞的,那么 A,B 就是关于 C 条件独立的;否则, A,B 不是关于 C 条件独立的。
例子

判断图中a与b是否在c条件下独立?
判断 a 和 b 是否是 c下条件独立的: a 到 b 只有一条路径 a->e->f->b 。 考虑路径上的点 e 和 f :其中e 是Converge类型的,且 e 的儿子节点就是 c ,根据条件2,e不阻断。而节点f是Diverge类型节点,根据条件1,f不在c中,所以也有a,b不是c条件下独立。
判断图中a与b是否在f条件下独立?
判断 a 和 b 是否是 f 下条件独立的:路径 a->e->f->b 上的所有节点。考虑路径上的点e和f:节点 e 是Converge类型的,e 和她的儿子节点 c 都不在 f 中,所以根据条件2,e是阻断路径的节点。节点 f 是Diverge类型节点,且 f 节点就在 f中,所以 f 节点阻断了路径。 结论:a 和 b是 f 下条件独立的。
2.后门调整准则
2.1 干预 /
算子

定义:将因果图中结点
性质:在对结点

与“以变量为条件”(conditioning)的区别:
- 表现形式:
vs
- “以变量为条件”是选取观测到T=1的样本子集,“干预”是让所有样本T=1
- “以变量为条件”不改变原始数据的分布,“干预”改变了原始数据的分布
2.2 截断式因式分解(Truncated Factorization)

根据有向图因式分解公式:
根据截断式的性质,
边际化
和
的区别在与一个是乘以
,一个是乘以
,
表示相关性,
表示因果性,由于confounder
的存在,
。
如果切断和
之间的联系,那么
2.3 后门调整(Backdoor Adjustment)
和2.2节同样的DAG图,推导后门调整公式:
第1个等号:
第2个等号:because y blocks all backdoor paths from t to y, the only association flowing from t to y is causal association. so we can remove in the factor for y
第3个等号: 简单理解就是根据后门准则,给定了,切断了
这条路,使得只有
这一条路,而这条路是我们想获得的causal association.
消除是因为:1.
切断了
的parents,没有in-edge association流向
; 2. 如果存在association则为T 的 out-edge association,则会与Y形成一个collider,association 被 collider 切断。所以T与W独立下面举个例子,

切断
because we're intervening on t,there are no incoming edges to t, so no association can flow from t to x through backdoor paths,so the only way that association could flow from t to x,is through paths that are directed out of t,not backdoor paths and this is where the second part of the backdoor criterion come into play, we cannot have any association from t to w, that's directed out of f because it will run into colliders, so in this
另一种证明方法:
这种证明的方法一个重点是
