概率图模型基础(1)——简介

1. 分布及其因子操作

1.1 联合分布

以学生成绩为例:共有以下几个变量:Intelligence(i^0=low, i^1)、Diffculty(d^0=easy. d^1=hard)、Grade(g^1=A, g^2=B, g^3=C)。

notation

其联合分布为:
Joint Distribution

这三种变量的组合共有2*2*3=12种。

1.2 联合分布与条件分布(Condition Probability Distribution, CPD)的一些计算

1. Reduction

设置筛选条件:以选取成绩为A的人为例,把所有得A的人(G=g^1)选出来。

Conditioning

2. Renormalization

重新标准化,将筛选出来的值除以其概率和,保证标准化后的概率和为1。
Renormalization
3. Marginalization

计算边缘概率
Marginalization

2. Factors

2.1 Factor定义

factory 可以理解为一种函数或者表格。其目的是将变量(X_1,...,X_k)映射到某一个实数集。
例如:

  • 在图Joint Distribution中,I,D,G就是一种factor。对于其中的每一行,都有一个对应的实数。
  • 在图normalization中,I,D有是一种factor,没有G的原因是其他两个变量与变量G没有关系,G在其中视为常量即可。

2.2 Factor的运算

product

类似于数据库中的join关键字连接。


product
add

对应1.2 节中的Marginalization。


Marginalization
Reduction

对应1.2 节中的Reduction。


Reduction

2.3. 符号抽象

为了方便,我们通常将包括但不限于上述的操作符抽象为:


image.png

4. 参考来源

  • 斯坦福公开课——Probabilistic Graphical Models
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 概率图模型是之前一直搁置的内容,然而躲得过初一躲不过十五,看葫芦书时发现其中有整整一章关于概率图,方才意识到概率图...
    单调不减阅读 11,805评论 0 6
  • 机器学习的核心思想就是根据已知的内容去推测未知的内容,然后在已知和未知之间建立起联系,这个联系就是机器学习中的各种...
    闪电随笔阅读 3,964评论 1 7
  • 这一部分没有参考资料,自己看书的时间也比较短,对于一些概念也比较模糊,参考了很多人的学习笔记,整理摘抄。。。。。。...
    一杭oneline阅读 1,392评论 0 0
  • 基本概念 离散型随机变量 如果随机变量X的所有取值都可以逐个列举出来,则称X为离散型随机变量。相应的概率分布有二项...
    诺馨阅读 11,446评论 0 0
  • 神经网络 原理 《机器学习》周志华 14.1 隐马尔可夫模型 机器学习最重要的任务,是根据一些已观察到的证据(例如...
    hxiaom阅读 1,395评论 0 1