大师兄的贝叶斯网络学习笔记(十):贝叶斯网络(五)
大师兄的贝叶斯网络学习笔记(十二):贝叶斯网络(七)
四、贝叶斯网的构造
3. 确定网络参数
- 贝叶斯网络的参数,即各变量的概率分布,一般是通过数据分析获得的,不过,有时也可以从问题的特性直接得到。
- 例:考虑一个种马农场中的公马、母马和它们所生育的后代之间的基因遗传关系。假设基因a是一个隐性致病基因,对应的显性基因A。当没有任何信息时,任意一匹马关于该疾病的基因型可能是以下三者之一:
- aa(患病)
- aA(携带者)
- AA(正常)
- 根据基因遗传学,可以直接确定任意一匹马的基因型
与它的父母的基因型
和
之间的概率关系
。
|
aa | aA | AA |
---|---|---|---|
aa | (1,0,0) | (0.5,0.5,0) | (0,1,0) |
aA | (0.5,0.5,0) | (0.25,0.5,0.25) | (0,0.5,0.5) |
AA | (0,1,0) | (0,0.5,0.5) | (0,0,1) |
- 根据考察表的第一行,当公马的基因是aa时,如果母马也是aa,则根据基因遗传交换的规律,后代只可能是aa,所以其分布是(1,0,0);
- 如果母马是aA,则后代不可能是AA,而有50%的可能是aa,50%的可能是aA,因此其分布是(0.5,0.5,0);
- 如果母马是AA,则后代一定是aA,因此其分布是(0,1,0)。
- 人们往往假设条件分布具有某种规律,称为局部结构,常见的局部结构有两种:
- 因果机制独立(causal independence)
- 环境独立(context specific independence)
3.1 因果机制独立
- 因果机制独立值得是多个原因独立地影响同一个结果,在前面的例子中,地震(E)和盗窃(B)都可以触发警铃(A),但是两者的机制不同,因此可以假设地震和盗窃独立地影响警铃响。
- 为了将含义说明得更准确,引入两个辅助变量
代表警铃因地震而响、
代表警铃因盗窃而响,故
。
- 因果机制独立假设的确切含义是:变量
相互独立。
- 这里的E,B,A之间是一个噪音或(noisy OR)的关系。
- 假设图中的箭头表示因果关系,说
独立影响Y,如果存在于Y有共同状态空间的变量
,使得:
- 对每个
依赖于
,并且给定
独立于其它的
;
- 在
上存在一个满足交换律和结合律的算子 * ,使得
。
- 就是会所不同原因对Y的影响是独立的,总影响是个原因的单独影响按算子* 的合成结果。
- 如果把
称为
对
的贡献,把* 称为基本合成算子,把
称为
对
的贡献概率分布。
- 在变量取二值的情况下,当基本合成算子 * 是逻辑或
时,图中所示的事噪音或门。
- 当他的逻辑与
时,图中所示的噪音门。
- 噪音最大(小)门是它们的自然推广,此时 * 是最大(小)值运算。
- 当*是加法运算时,图中模式称为噪音加法器。
- 定理:设原因变量
独立地影响结果变量
,那么对任意
,有
,其中*是基本合成算子。
- 此定理说明的事条件概率分布
可以从各原因的贡献概率分布出发得到,这大大减少了参数的个数。
- 在所有变量均取二值时,式右端的概率分布所包含独立参数的个数是2m个,而不是
个。
3.2 环境独立
- 环境独立是指在特定环境下才成立的条件独立关系。
- 一个环境(context)是一组变量及其取值的组合。
- 设一个环境所涉及的变量的集合是C,其取值是c,我们用C=c来记该环境。
- 设X,Y,Z,C是4个两两交空的变量集合,C的取值是c。
- 我们说在环境C=c中X与Y在给定Z时相互条件独立。
- 如果当
时,有
- 若Z为空,则称X与Y在环境C=c中相互独立。