大师兄的贝叶斯网络学习笔记(四十一):贝叶斯网络(十五)

大师兄的贝叶斯网络学习笔记(四十):贝叶斯网络(十四)

八、结构学习

1. 似然函数与模型选择
  • 参数学习假设已知变量间的定性关系,通过数据分析揭示变量间的定量关系。
  • 结构学习则是要同时揭示变量间的定性和定量关系。一般分两步讨论:
  • 模型选择(model selection):用什么样的准则来评判不同模型结构之优劣。
  • 模型优化(model optimization):把最优的模型结构找出来。
1. 似然函数与模型选择
  • X_1,X_2,...,X_n为一组随机变量,D=(D_1,D_2,...,D_m)是关于这些变量的一组数据,这里关心的是如何找出一个相对于D在某意义下最优的贝叶斯网络。
  • 设G是一个以X_1,X_2,...,X_n为节点的贝叶斯网络结构。
  • G相对于数据D的优劣可以用一个评分函数(scoring function)来度量:
  • 最优参数对数似然函数(parameter maximized loglikelihood function)是一个基于似然函数的评分准则,简称优参对数似然函数。
  • 在贝叶斯框架下,推出另一个称为CH评分的准则。
  • 在大样本的前提下得到第三个准则,即BIC评分。
  • 结构G与相应的参数集合\theta_G组成贝叶斯网络(G,\theta_G),这里给θ加下标石因为不同的网络结构对应不同的参数集合。
  • 在贝叶斯网络(G,\theta_G)中,可以计算每一个样本D_l的概率P(D_l|g,\theta_G),从而在I.I.d的假设下,可以计算logP(D|G,\theta_G)
  • 在参数学习中,网络结构G已知,这就是参数向量\theta_G的对数似然函数。
  • 根据最大似然估计原则,相对于数据D最优的参数值\theta^*_G应该使logP(D|G,\theta_G)达到最大,即logP(D|G,\theta^*_G)=\sup_{\theta_G}logP(D|G,\theta_G)
  • 在结构学习中,网络结构G和网络参数\theta_G都是需要确定的对象。
  • 于是可以将logP(D|G,\theta_G)视为二元组(G,\theta_G)对数似然函数,记为l(G,\theta_G|D) = logP(D|G,\theta_G)
  • 将最大似然函数估计原则加以推广,得到如下原则:相对数据D最优的贝叶斯网络(G^*,\theta^*_G)应该是对数似然函数达到最大,即l(G^*,\theta^*_G|D) = \max_G\sup_{\theta_G}l(G,\theta_G|D)
  • 在概念上,寻找最优贝叶斯网络的2过程可以分成两步:
  • 第一步寻找最优结构G^*
  • 第二步优化参数\theta_G,为刻画第一步所使用的准则,对任一网络结构G,定义l^*(G|D)=\sup_{\theta_G}l(G,\theta_G|D)
  • 作为网络结构G的函数,l^*(G|D)称为优参对数似然函数。最优结构G^*应该使优参对数似然函数达到最大,即l^*(G^*|D)=\max_Gl^*(G|D),称为最大优惨似然准则
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容