大师兄的贝叶斯网络学习笔记(八):贝叶斯网络(三)

大师兄的贝叶斯网络学习笔记(七):贝叶斯网络(二)
大师兄的贝叶斯网络学习笔记(九):贝叶斯网络(四)

三、贝叶斯网的概念

  • 在示P(X_1,...,X_n)=\prod^n_{i=1}P(X_i|\pi(X_i))的分解中,变量 X_i的分布直接依赖于\pi(X_i)的取值。
  • 如果给定\pi(X_i),则X_i\{X_1,...,X_{i-1}\}中的其他变量条件独立。
  • Pearl(1986)提出用如下方法构造一个有向图来表示这些依赖和独立关系:
  1. 把每个变量都表示为一个节点。
  2. 对于每个节点X_i,都从\pi(X_i)中的每个节点画一条有向边到X_i
  • 在上面案例中\pi(B)=\pi(E)=\phi,\pi(A)=\{B,E\},\pi(J)=\{A \} ,\pi(M)=\{A\}
  • 按照上述方法,可以得到有向图如下:
  • 图中的变量之间的依赖和独立关系一目了然:
  • A依赖于B和E;
  • M和J都依赖于A;
  • 而从B何E没有直接到M和J的有向边,表示给定A,这两组变量相互条件独立;
  • 上面提到,变量A依赖于B和E,条件概率分布P(A|B,E)定量地回答了这个问题:
  • 当盗窃和地震都发生时,警铃响的概率P(A=y|B=y,E=y)是0.95;
  • 当只发生盗窃但没有发生地震时,警铃响的概率P(A=y|B=y,E=n)是0.29;
  • 当只发生地震但没有发生盗窃时,警铃响的概率P(A=y|B=n,E=y)是0.94;
  • 而当盗窃和地震都没有发生时,警铃响的概率P(A=y|B=n,E=n)是0.001。
  • 类似地,P(M|A)和P(J|A)分别定量刻画了M和J如何依赖于A。变量B和E不依赖于其他变量,P(B)和P(E)给出他们的边缘分布。
  • 图中所示的有向图和5个概率分布合在一起,就构成一个贝叶斯网
  • 其中从X到节点Y有一条边,那么称X为Y的父节点,而Y为X的子节点。
  • 一个节点的所有父节点和子节点成为它的邻居节点。
  • 没有子节点的节点称为叶节点。
  • 一个节点的祖先节点包括其父节点及爷节点的祖先节点。
  • 根节点无祖先节点。
  • 一个节点的后代节点包括其子节点及子节点的后代节点。
  • 叶节点无后代节点。
  • 一个节点的非后代节点包括所有不是其后代节点的节点。
  • 在一有向图中,若某节点是它自己的祖先节点,则该图包含一个有向环。
  • 有向五圈图是不含有向环的有向图。
  • 贝叶斯网络是一个有向无环图,其中节点代表随机变量,节点间的边代表变量之间的依赖关系。
  • 每个节点都附有一个概率分布,根节点X所附的是它的边缘分布P(X),而非根节点X所附的是条件概率分布P(X|\pi(X))
  • 贝叶斯网络可以从定性和定量两个层面来理解:
  • 在定性层面,它用一个有向无环图描述了变量之间的依赖和独立关系。
  • 在定量层面,它则用条件概率分布刻画了变量对其父节点的依赖关系。
  • 在语义上,贝叶斯网络是联合概率分布的分解的一种表示。
  • 更具体地,假设网络中的变量为X_1,...,X_n,那么把各变量所附的概率分布相乘就得到了联合分布:P(X_1,...,X_i)=\prod^n_{i=1}P(X_i|\pi(X_i))
  • 其中当\pi(X_i)=\phi时,P(X_i|\pi(X_i))即边缘分布P(X_i)
  • 联合概率分布的分解降低了概率模型的复杂度。
  • 贝叶斯网络的引入虽然没有进一步降低福再度,但它为概率推理提供了很大的方便,这主要是因为贝叶斯网络一方面是严格的数学语言,适合于计算机的处理;另一方面,它又直观易懂,方便人们讨论交流和建立模型。
  • 另外,Pearl还认为,贝叶斯网络推理提供了人脑推理过程的一个模型,因为依赖和独立关系是人们日常推理的基本工具,而且人类知识的基本结构也可以用依赖图来表达。
  • 事实上,越来越多的研究领域开始采用贝叶斯网络来展示问题的结构,从而使贝叶斯网络的影响远远超出了不确定性推理和人工智能的范围。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

友情链接更多精彩内容