四、单变量网络参数估计
- 考虑由一个多值变量X组成的贝叶斯网络:
- 设X由r个取值,
![]()
- 网络的参数包括
![]()
- 用θ记向量
![]()
- 由于概率分布的规范性,
,实际上该网络只有r-1个独立参数。
- 先考虑θ的最大似然估计,设有一组i.i.d:
- 数据
,其中满足
的样本个数是
![]()
- 则有
![]()
- 具有这个形式的似然函数称为多项似然函数(multinomial likelihood function),其中的
是充分统计量。
- 相应的对数似然函数为
。
- θ的最大似然估计
由
给出:
- 其中
是样本量。
- 考虑θ的贝叶斯估计,多想似然函数的共轭分布族是Dirichlet分布族,所以一般假设先验分布
是Dirichlet分布
,即:p(\theta)=\frac{\Gamme(a)}{\prodr_{i=1}\Gamma(a_i)}\prodr_{i=1}\theta^{a_i-1}_i
- 其中
![]()
- 当r=1时,Dirichlet分布
就是β分布
。
- 假设
为Dirichlet分布
就等于假设关于θ的先验知识相当于a个虚拟数据样本,其中满足
的样本数为
。
- 所以a称为等价样本量。
- θ的后验分布
为
- 即是
是Dirichlet分布
。
- 关于下一个样本
的概率分布的贝叶斯估计为:
- 当样本量m很小时,这个估计主要以来先验知识。
- 当样本量m增大时,这个估计越来越多地依赖于数据,越来越接近最大似然估计
,而先验知识的影响越来越小。