Hammersley-Clifford定理证明

Proof of Hammersley-Clifford Theorem

[TOC]

​ 最近看语义分割论文DeepLab,有使用全连接CRF恢复局部的细节信息,提升分割精度。又回去复习了下CRF,仍然有一个问题很困扰: "根据Hammersley Clifford定理,一个无向图模型的概率可以表示为定义在图上所有最大团上的势函数的乘积";为什么可以这么定义,也就是Hammersley Clifford定理证明过程,书中并没有没有给出;网上看到也有一些童鞋有同样的困惑,本文翻译并备注了证明过程,希望对大家有所帮助。

原文地址: Proof of Hammersley-Clifford Theorem

本文下载地址:Hammersley-Clifford定理证明

依赖知识

a): 熟悉概率论的基础知识

b):了解概率图模型;熟悉MRF,最大团相关知识

定义1

​ 一个无向图模型G称之为马尔科夫随机场(MRF),如果两个顶点被观测顶点分割情况下条件独立。也就是说对图中任意顶点X_i ,以下条件属性成立
P(X_i|X_{G\backslash i}) = P(X_i|X_{N_i}) \tag 1
X_{G \backslash i} 代表除了X_i 之外的所有顶点,X_{N_i} 代表i的所有邻居顶点-即所有与X_i 相连的顶点。

定义2

​ 在无向图模型G上的一个概率分布P(X) 称之为吉布斯分布,如果它能够因子分解为定义在团(clique)上的正函数的乘积,这些团覆盖了G的所有顶点和边。即
P(X) = \frac 1 Z \prod_{c \in C_G} \phi_c(X_c) \tag 2
C_G 是G上所有(最大)团的集合,Z=\sum_x \prod_{c \in C_G} \phi_c(X_c) 是归一化常量。

证明过程

​ Hammersley Clifford告诉我们这两个定义是等价的,下面将证明这个定理。

反向证明(吉布斯分布=>MRF)

​ 设D_i = N_i \bigcup \{X_i\} 是包含X_i 邻居顶点和X_i 本身的集合。从等式(1)的右边开始
P(X_i|X_{N_i}) = \frac {P(X_i,X_{N_i})} {P(X_{N_i})} \tag 3

\ \ \ \ \ \ \ =\frac {\sum_{G \backslash D_i} \prod_{c \in C_G} \phi_c(X_c)} {\sum_{x_i} \sum_{G \backslash D_i} \prod_{c \in C_G} \phi_c(X_c)} \tag 4

​ 基于是否包含X_i 将最大团C_G 分为两组:

C_i = {c \in C_G: X_i \in c}R_i = {c \in C_G: X_i \notin c} ;现在可以将等式(4)分为C_iR_i 上的乘积。
P(X_i|X_{N_i}) =\frac {\sum_{G \backslash D_i} \prod_{c \in C_i} \phi_c(X_c) \prod_{c \in R_i} \phi_c(X_c)} {\sum_{x_i} \sum_{G \backslash D_i} \prod_{c \in C_i} \phi_c(X_c) \prod_{c \in R_i} \phi_c(X_c)} \tag 5

= \frac {\prod_{c \in C_i} \phi_c(X_c) \sum_{G \backslash D_i} \prod_{c \in R_i} \phi_c(X_c)} {\sum_{x_i} \prod_{c \in C_i} \phi_c(X_c) \sum_{G \backslash D_i} \prod_{c \in R_i} \phi_c(X_c)} \tag 5

​ 在G \backslash D_i 上的求和可以移到C_i 乘积的后面,因为C_i 团中所有的顶点一定都来自D_i; 因为C_i 只包含X_i 和与X_i 相邻的顶点,由D_i 的定义可知;因而 C_i 乘积对于在G \backslash D_i 上的求和相当于常数项,故可以把C_i 乘积拿到G \backslash D_i 上的求和的外面。

​ 同样注意到因子\sum_{G \backslash D_i} \prod_{c \in R_i} \phi_c(X_c) 没有包含X_i ,并且可以从分母移除,因为分子也包含了它。因此有:
P(X_i|X_{N_i}) = \frac {\prod_{c \in C_i} \phi_c(X_c)} {\sum_{x_i} \prod_{c \in C_i} \phi_c(X_c)} \tag 7

\ \ \ \ \ \ \ \ \ \ =\frac {\prod_{c \in C_i} \phi_c(X_c)} {\sum_{x_i} \prod_{c \in C_i} \phi_c(X_c)} * \frac {\prod_{c \in R_i} \phi_c(X_c)} {\prod_{c \in R_i} \phi_c(X_c)} \tag 8

\ \ \ \ \ \ \ \ \ \ =\frac {\prod_{c \in C_G} \phi_c(X_c)} {\sum_{x_i} \prod_{c \in C_G} \phi_c(X_c)} \tag 9

= \frac {P(X)} {P(X_{G \backslash \{i\}})} \tag {10}

= P(X_i|X_{G \backslash \{i\}}) \tag {11}

​ 消除了G \backslash D_i 上的求和项后,在公式(8)的分子分母乘上一个相同的因子,再次引入势函数;最终公式(11)与公式(1)的左边相等,证明了反向等价。

正向证明(MRF=>吉布斯分布)

​ 对于任意s \subset G,定义一个如下的候选势函数:

f_s(X_s=x_s) = \prod_{z \subset s} P(X_z=x_z,X_{G \backslash z} =0)^{-1^{|s|-|z|}} \tag {12}

  1. 等式右边的乘积是在s的所有子集上进行的。
  2. 对于s任意子集z, P(X_z=x_z,X_{G \backslash z} =0) 表示属于z的顶点(随机变量取值)与s一致,图中其它顶点给默认值(记做"0")。
  3. 当s集合与z集合顶点个数不同时指数为1,否则为0; |s| 表示集合s中元素(顶点)个数。
  4. 很显然f是正函数,概率都是非负的。
  5. 只需要需要证明如下两点,即可说明无向图模型的概率P(X) 可以表示为图上所有团的势函数乘积。
  1. \prod_{s \subset G} f_s(X_s) = P(X) \ \ \ (a)
  2. f_s(X_s) =1 如果s 不是一个团

证明第一点

​ 为证明第一点,先来展示一个恒等式:
0 = (1 - 1)^K = C_0^K - C_1^K + C_2^K + ... ... + (-1)^KC_K^K \tag {13}

a. C_N^K 表示从K个元素中选取N个元素的所有组合情况

b. 现在证明\prod_{s \subset G} f_s(X_s) 中所有的因子都可以互相抵消,除了P(X)

c. 对于任意子集z \in G ,及z 相关的因子\Delta = P(X_z, X_{G \backslash z = 0}) ;它在s不包含z的情况下没有出现(此时z不会是s的子集);

d. 它在s=z 情况下出现一次(z=s是s的子集),因而\Delta ^{-1^0} = \Delta

f. 它在s包含z以及另外一个元素的情况下出现C_1^{|G|-|z|} 次;因为s的选择有C_1^{|G|-|z|} 种,并且满足|s|-|z|=1 ,因此这时\Delta ^{-1^1} = \Delta ^{-1}

g. 它在s包含z以及另外两个个元素的情况下出现C_2^{|G|-|z|} 次;因为s的选择有C_2^{|G|-|z|} 种,并且满足|s|-|z|=2 ,因此这时\Delta ^{-1^2} = \Delta

h. 依次类推... ... ;最终第一点的等式(a)左边, z相关因子\Delta 所有乘积就是:
\Delta * \Delta^{-1(C_1^{|G|-|z|})} * \Delta^{-1^2(C_2^{|G|-|z|})} * ... * * \Delta^{-1^{|G|-|z|}(C_{|G|-|z|}^{|G|-|z|})}

= \Delta ^{(1- C_1^{|G|-|z|} + C_2^{|G|-|z|} + (-1)^{|G|-|z|}(C_{|G|-|z|}^{|G|-|z|})) }

​ 令K=|G|-|z| , 根据公式(13)可以看出所有的因子互相抵消\Delta ^0= 1 ;除了一种情况z=G 。因而有
\prod_{s \subset G} f_s(X_s) =\Delta_{\{z=G\}} =P(X_G, X_{G \backslash G = 0}) =P(X_G) = P(X)
i. 第一点证明完毕。

证明第二点

​ 为证明第二点,需要使用马尔科夫属性,如果s不是一个团,那么一定有两个属于s的顶点a、b,它们之间没有边连接,我们按照如下方式重写f_s(X_s)

f_s(X_s=x_s)
= \prod_{z \subset s} P(X_z=x_z,X_{G \backslash z} =0)^{-1^{|s|-|z|}} \tag {14}

= \prod_{w \subset s \backslash \{a,b\}} \left[ \frac {P(X_w,X_{G \backslash w}=0) P(X_{w \bigcup \{a,b\}},X_{G \backslash w \bigcup \{a,b\}}=0)} {P(X_{w \bigcup \{a\}},X_{G \backslash w \bigcup \{a\}}=0) P(X_{w \bigcup \{b\}},X_{G \backslash w \bigcup \{b\}}=0) } \right]^{-1^*} \tag {15}

​ 公式(15)将z \subset s 分为4中情况:z=w, z=w \bigcup \{a\},z=w \bigcup \{b\} 和 z = w \bigcup \{a,b\} ,并显示的写出了这些因子。注意公式(15)中的位置是对的哦。接下来将证明他们互相抵消。因此指数是多少不重要了,这里用-1^* 表示。

根据贝叶斯规则有:

\frac {P(X_w,X_{G \backslash w}=0)} {P(X_{w \bigcup \{a\}},X_{G \backslash w \bigcup \{a\}}=0)}

=\frac {P(X_a=0|X_b=0,X_w,X_{G \backslash w \bigcup \{a,b\}}=0) P(X_b=0,X_w,X_{G \backslash w \bigcup \{a,b\}}=0)} {P(X_a|X_b=0,X_w,X_{G \backslash w \bigcup \{a,b\}}=0) P(X_b=0,X_w,X_{G \backslash w \bigcup \{a,b\}}=0)} \tag {16}

=\frac {P(X_a=0|X_b,X_w,X_{G \backslash w \bigcup \{a,b\}}=0) P(X_b,X_w,X_{G \backslash w \bigcup \{a,b\}}=0)} {P(X_a|X_b,X_w,X_{G \backslash w \bigcup \{a,b\}}=0) P(X_b,X_w,X_{G \backslash w \bigcup \{a,b\}}=0)} \tag {17}

=\frac {P(X_{w \bigcup \{b\}},X_{G \backslash w \bigcup \{b\}}=0)} {P(X_{w \bigcup \{a,b\}},X_{G \backslash w \bigcup \{a,b\}}=0)} \tag {18}

a) 公式(16)依据概率分解P(a,b)=P(a|b)*P(b) ; 首先仅仅看因子部分P(X_w,X_{G \backslash w}=0) \\= P(X_a=0,X_b=0,X_w,X_{G \backslash w \bigcup \{a,b\}}=0) \\=P(X_a=0|X_b=0,X_w,X_{G \backslash w \bigcup \{a,b\}}=0) P(X_b=0,X_w,X_{G \backslash w \bigcup \{a,b\}}=0)

b) 同理分母部分一样的分解

c) 公式(16)的左边部分,由于X_aX_b 在给定图剩余部分是条件独立的,因此可以将X_b=0 替换为X_b ;分子分母都替换了。

d) 公式(16)的右边部分,分子分母是一样的,可以约掉,实际上是先约掉,然后在同时乘一个相同的因子;得到公式(17),自然而然概率连乘得到公式(18)

e) 将公式(18)结果带入公式(15); 可知公式(15) 恒等于1. 第二点证明完毕。

疑问点

  1. 本文的证明,只能说明无向图模型的概率可以分解为G上所有团的势函数乘积;并不能说明是所有的最大团的势函数乘积。 哪位网友知道,麻烦给我回复,非常感谢!
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,386评论 6 479
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,939评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,851评论 0 341
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,953评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,971评论 5 369
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,784评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,126评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,765评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,148评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,744评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,858评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,479评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,080评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,053评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,278评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,245评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,590评论 2 343

推荐阅读更多精彩内容