《深度学习》:直面配分函数

许多概率模型(通常是无向图模型)由一个未归一化的概率分布定义,我们必须除以配分函数来归一化

对数似然梯度

通过最大似然学习无向模型特别困难的原因在于配分函数依赖于参数。对数似 然相对于参数的梯度具有一项对应于配分函数的梯度:

这是机器学习中非常著名的正相(positive phase)和负相(negative phase)的 分解。

即得到

随机最大似然和对比散度

可以用MCMC采样求解这个梯度

对比散度算法降低了吉布斯采样花费的时间,从数据分布中获取样本是计算代价最小的,因为它们已经在数据集中了。初始时,数 据分布并不接近模型分布,因此负相不是非常准确。幸运的是,正相仍然可以准确 地增加数据的模型概率。进行正相阶段一段时间之后,模型分布会更接近于数据分 布,并且负相开始变得准确。

当然,CD仍然是真实负相的一个近似。CD未能定性地实现真实负相的主要原因是,它不能抑制远离真实训练样本的高概率区域。这些区域在模型上具有高概率, 但是在数据生成区域上具有低概率,被称为虚假模态(spurious modes)。图18.2解 释了这种现象发生的原因。基本上,除非 k 非常大,模型分布中远离数据分布的峰 值不会被使用训练数据初始化的马尔可夫链访问到。

另一个解决CD中许多问题的不同策略是,在每个梯度步骤中初始化马尔可夫链为先前梯度步骤的状态值。这个方法首先被应用数学和统计学社群发现,命名 为随机最大似然(SML)(Younes, 1998)

伪似然

蒙特卡罗近似配分函数及其梯度需要直接处理配分函数。有些其他方法通过训 练不需要计算配分函数的模型来绕开这个问题。这些方法大多数都基于以下观察: 无向概率模型中很容易计算概率的比率。这是因为配分函数同时出现在比率的分子 和分母中,互相抵消

假设我们将 x 分为 a,b 和 c,其中 a 包含我们想要的条件分布的变量,b 包含我们想要条件化的变量,c 包含除此之外的变量

在极端情况下,a 可以是单个变量,c 可以为空,那么该计算仅需要估计与单 个随机变量值一样多的 ˜ p。

在这种情况下,我们已经使a尽可能小,但是c可以大到x2:n。如果我们简单地将c移 到 b 中以减少计算代价,那么会发生什么呢?这便产生了伪似然

得分匹配和比率匹配

得分匹配提供了另一种训练模型而不需要估计 Z 或其导数 的一致性方法。对数密度关于参数的导数 ∇xlogp(x),被称为其得分(score),得分 匹配这个名称正是来自这样的术语。得分匹配采用的策略是,最小化模型对数密度 和数据对数密度关于输入的导数之间的平方差期望

噪声对比估计

具有难求解的配分函数的大多数模型估计都没有估计配分函数。SML和CD只 估计对数配分函数的梯度,而不是估计配分函数本身。得分匹配和伪似然避免了和配 分函数相关的计算。

噪声对比估计(noise-contrastive estimation,NCE)(GutmannandHyvarinen, 2010) 采取了一种不同的策略。在这种方法中,模型估计的概率分布被明确表示 为

NCE 的思想很简单,它希望我们将真实的样本和一批“噪声样本”进行对比,从中发现真实样本的规律出来。

具体来说,我们引入一个噪声分布,并且设定联合分布

现在我们可以应用标准的最大似然学习拟合 pjoint 到 ptrain 的监督学习问题:

这样我们就得到了模型的参数和配分值c

估计配分函数

如果想要知道两个模型哪个比较好,可以比较似然函数

用蒙特卡洛方法求解

如果分布 p0 接近 p1,那么式(18.44)能够有效地估计配分函数 (Minka, 2005)。 不幸的是,大多数时候 p1 都很复杂(通常是多峰值的),并且定义在高维空间中。 很难找到一个易求解的 p0,既能易于评估,又能充分接近 p1 以保持高质量的近似。 如果 p0 和 p1 不接近,那么 p0 的大多数采样将在 p1 中具有较低的概率,从而在 式(18.44)的求和中产生(相对的)可忽略的贡献。

我们现在关注两个解决高维空间复杂分布上估计配分函数的方法:退火重要采样和桥式采样。此处暂且略过

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,335评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,895评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,766评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,918评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,042评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,169评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,219评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,976评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,393评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,711评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,876评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,562评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,193评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,903评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,699评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,764评论 2 351

推荐阅读更多精彩内容

  • https://mp.weixin.qq.com/s/BuHiG9FjX-OiSNWx3KquQQ 17.随机梯度...
    _龙雀阅读 3,770评论 0 4
  • https://developers.google.com/machine-learning/crash-cour...
    iOSDevLog阅读 2,654评论 1 11
  • 荨荨看看手机,什么话都说不出来,眼泪就那样啪嗒啪嗒的摔了一地,耳边回旋的一直是那句:我明天再打给你吧…… 这是第二...
    紫琳玉梦阅读 1,284评论 0 1
  • 当你陷入低谷的时候,你会怎么办?一味的哭天抢地,一味的萎靡抱怨?还是养精蓄锐,准备着东山再起? CC小姐从出生就和...
    陈粗枝阅读 250评论 0 0
  • 我是桔一个,为何摘下我。要吃你就整个吃,别让我的心片片地破。
    玄空的北阅读 205评论 1 4