RNN生成模型的采样策略

查看原文

RNN卷积神经网络可以用来做生成模型，目前已经有很多很成熟的应用，比如几个词生成一首古诗、一幅图片自动生成音乐等等。但是之前一直困扰我的一个问题是，在CNN中，将一个已经训练好的模型来预测一幅图片（假设是个分类问题），那么只要给定一张图片，它的分类肯定不会变化。而RNN在每次给定了输入后，怎么生成了不一样的输出结果呢？

在网上查了一些资料发现RNN在生成结果的时候会做一个sampling的过程，而网上很少有中文资料讲RNN是如何做sample的，在看过一些代码和一些文章后，写下这篇文章希望能对sample有个直观的了解。

Greedy Search

这是最简单的方式，直接采用softmax后的最大概率所对应的结果。
这样处理之后，在给定一个输入后，输出结果也就固定了，对于生成模型中，显然不具备结果多样性的特点。

Beam Search

上面的策略是只输出概率最高的一个结果，那现在策略改了，我取输出概率最高的前N个结果，然后随机选择一个作为最终结果，那是不是结果就有了多样性呢？
但是这种策略也有局限性，那就是在取出的前N个结果中，每个结果出现在最终结果的概率其实是一样的，这样子就丢失了一定得准确性。

Random Sampling

随机采样策略是目前比较流行的做法。基于输出结果的概率分布来随机采样，这样既保证了输出结果的多样性，也保留了输出结果的准确度。

举个例子解释下随机采样相对于前两种策略的优点。
假如给定的输入生成的输出结果是[0.8, 0.15, 0.05]，那么在理想的情况下，我运行100次，采用Random Sampling生成的结果有80次取第一位代表的结果，15次取第二位，5次取第三位。如果采用Beam Search结果中有有50次取第一位，50次取第二位。如果采用Greedy Search，那么100次都只取第一位。

Random Sampling还有一个问题是问题的多样性有时候希望能有所控制，比如上面的例子，我如果倾向于生成更准确的结果，但是仍然要保留多样性，目标就是增加让概率值高的变得更高，概率值低的变得更低。具体的操作是使用temperature来控制。

def sample(preds, temperature=1.0):
        '''
        当temperature=1.0时，模型输出正常
        当temperature=0.5时，模型输出比较保守
        当temperature=1.5时，模型输出比较open
        '''
        preds = np.asarray(preds).astype('float64')
        preds = np.log(preds) / temperature
        exp_preds = np.exp(preds)
        preds = exp_preds / np.sum(exp_preds)
        return preds

将[0.8, 0.15, 0.05]分别进行temprature为0.5和1.5时，输出的值为

[0.96240602 0.03383459 0.0037594 ]
[0.67336313 0.22058883 0.10604805]

比较直观地可以看到结果，当概率分布比较均匀时，随机采样的结果也会比较分散，反之比较集中。

一个更直观的图

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 213,047评论 6赞 492
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,807评论 3赞 386
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 158,501评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,839评论 1赞 285
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,951评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,117评论 1赞 291
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,188评论 3赞 412
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,929评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,372评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,679评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,837评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,536评论 4赞 335
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,168评论 3赞 317
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,886评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,129评论 1赞 267
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,665评论 2赞 362
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,739评论 2赞 351

RNN生成模型的采样策略

Greedy Search

Beam Search

Random Sampling

推荐阅读更多精彩内容