后验概率最大与结构风险最小的等价性证明

目录
[toc]


1. 后验概率和结构风险的定义

1.1 后验概率定义

后验概率是从贝叶斯公式而来,贝叶斯公式如下:
P(Y|X)=\frac{P(X|Y)P(Y)}{P(X)}
以分类问题来理解该公式,X代表观测到的特征样本,Y表示类别。特征是表象,类别是本质,P(Y|X)即后验概率,表示通过表象X归纳出其本质为Y的可信度有多高;P(X|Y)为似然率,表示从本质Y出发,生成各种表象X的可能性;P(X),P(Y)则是表象和本质的先验概率。所谓最大后验概率(Maximum A Posterior, MAP),直译为『最大的一个后验概率』,顾名思义就是通过观察到的表象X,可以归纳为很多Y,将最可信的那个Y作为X的真正本质。

1.2 后验概率的哲学意义

该公式包含深刻的哲学含义,上文已经从表象和本质的角度来阐述该公式。我们还可以从因果的角度来阐述该公式,X为果,Y为因,今天的果是由过去的因导致,后验概率甚至可以统计归纳出导致该结果的各种原因的可能性,所谓有果必有因。后验概率最大的那个是因,其它的是缘,所谓万事万物皆由因缘和合而生,这正是佛家的世界观,世界的一切色相皆可由一套概率模型表述,通过色相可归纳出世界的本质,即量子力学揭示的真空中量子涨落的概率本质,色即是空。先哲们通过观察色相,归纳出了这一宇宙的终极真理,用后验概率表示即为:
P(空|色)=1
如此思考很有意思,中国传统文化中,佛家则是贝叶斯派,道家则是频率派。佛家高僧往往见多识广,从大量样本中悟出世界的本源。而道家则往往闭门推演,从太极本源不断往外推算,进而生成万物,属于概率生成模型,可以用似然率来表示:
P(卦象|太极)= \left\{ \begin{split} & \times\times \\ & \cdots \\ & \times\times \end{split} \right.

1.3 后验概率的现实意义

回到贝叶斯公式,我们可以看到由观察到的表象去推断其背后的本质P(Y|X),其等比于由本质生成表象的概率P(X|Y)乘以该本质本身的概率P(Y)(贝叶斯公式的分子部分,对于给定的X,分母是确定的)。这有广泛的现实意义,即我们日常生活中判断一件事情产生的原因,即使某个原因导致该结果的概率非常大(P(X|Y)接近1),但该原因本身发生的概率非常小时(P(Y)接近0),我们往往也不会对该原因置信。
举个例子,彗星一旦撞击火星,毁灭火星的概率非常大,但相比火星人发生核战争的概率,彗星撞火星的概率可以忽略不计,所以导致如今火星文明消失的原因更大可能是当年火星人自己的核战争,而不是彗星。人类要以邻为鉴啊。
再举个更容易理解的例子,我们经常听到办公楼下的电瓶车发出报警声,但却很少有人在听到报警声后真的去检查电瓶车是否被撬。虽然被撬时报警的概率几乎为1,但被撬本身的概率非常小,所以往往就不置信了。实际确实如此,电瓶车报警,更有可能是被路过的人碰到了,虽然被轻轻碰到就报警的概率不太大,但相比于被撬,被碰本身的概率大多了。

1.4 结构风险定义

关于结构风险的介绍,在『泛化误差上界』一文中已经进行了详细介绍,这里仅作简介。结构风险即损失函数在X和Y的联合概率分布下的期望,即:
R_{exp}(f)=E_{X\times Y}[L(y,f(x))]
后验概率最大实际上等价与结构风险最小,关于其证明如下。

2. 后验概率最大与结构风险最小的等价性证明

后验概率最大,即对某个特征样本x,其类别应该判定为后验概率最大的那个y,用数学语言表述即为:
y=f(x)=\argmax_{c_k}{P(Y=c_k|X=x)},\quad k=1,2,\cdots,K
若对任一x_i\in X,\quad i=1,2,\cdots,N,都采用后验概率最大进行判决,得到f(x_i)=c_{ki},则:
\sum_{i=1}^{N}P(Y=c_{ki}|X=x_i) \tag{1}
也是最大的。
对式(1)除以样本个数N可变形为期望形式:
E_X[P(Y=c_k|X=x)] \tag{2}
令损失函数为:
L(Y=c_k,f(X=x))= \left\{ \begin{split} 0,\quad f(X=x)\neq c_k \\ -1,\quad f(X=x)=c_k \end{split} \right.
则:
P(Y=c_k|X=x)=-\sum_{j=1}^{K}{P(Y=c_j|X=x)L(Y=c_j,f(X=x))}
将其代入式(2)可得:
\begin{split} E_X[P(Y=c_k|X=x)] &= E_X\left[-\sum_{j=1}^{K}{P(Y=c_j|X=x)L(Y=c_j,f(X=x))}\right] \\ &= -\sum_{i=1}^{N}{\left[P(X=x_i)\sum_{j=1}^{K}{P(Y=c_j|X=x)L(Y=c_j,f(X=x))}\right]} \\ &= -\sum_{i=1}^{N}{\sum_{j=1}^{K}{\left[P(X=x_i)P(Y=c_j|X=x_i)L(Y=c_j,f(X=x_i))\right]}} \\ &= -E_{X\times Y}\left[L(Y,f(X))\right] \\ &= -R_{exp}(f) \end{split} \tag{3}
由此可知,后验概率最大即上式(3)最大,也即R_{exp}(f)最小。
后验概率最大等价于结构风险最小得证。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,324评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,303评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,192评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,555评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,569评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,566评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,927评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,583评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,827评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,590评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,669评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,365评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,941评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,928评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,159评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,880评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,399评论 2 342

推荐阅读更多精彩内容