大师兄的贝叶斯网络学习笔记(三十五):贝叶斯网络(九)
大师兄的贝叶斯网络学习笔记(三十六):贝叶斯网络(十一)
七、缺值数据最大似然估计
1. EM算法的基本思想
1.1 例

- 设图a是一个贝叶斯网络N,其中所有变量均取二值,1或2。
- 设图b是从N的联合分布中抽样而得到的一组数据,它由两个完整样本
和两个缺值样本
组成。
- 考虑用EM算法来近似计算N参数的MLE估计。
- EM首先选择一组初始参数值
,如下所示:

- 从
出发,EM开始迭代,在第一次迭代中,先用
修补数据。
- 由于
,所以
被如下两个碎权样本替换:
- 修补后得到如下的碎权完整数据:

- 第一次迭代完成后的估计
如下:

- EM接着进入第二次迭代,先用
对数据进行修补,由于:
,
。
-
修补后的数据如下:
- 于是,在第二次迭代完成后得到的估计
如下:

- 如此迭代下去,可以看到这个过程快速地向如下结果收敛:

