注意力模型与标题生成

Xu, K., Ba, J., Kiros, R., Cho, K., Courville, A., Salakhudinov, R., ... & Bengio, Y. (2015, June). Show, attend and tell: Neural image caption generation with visual attention. In International conference on machine learning (pp. 2048-2057).


本文介绍了两种不同的注意力机制模型(硬的随机注意机制和软的确定注意机制),模型的功能是输入一张图片,生成一个k字标题。

一、两种机制的共同框架

1、编码器(如何处理图片):

对图片进行卷积特征提取,提取L个特征向量ai,每个向量都是从D个维度表示了一部分图像。

2、解码器(如何生成标题):

模型使用一个长的短期记忆(LSTM)网络,该网络会根据一个上下文向量Zt、隐藏状态ht-1和已生成标题Eyt-1,每隔一段时间生成一个标题的字。上下文向量Zt指图像的输入部分在时间t时的动态表示。下图是LSTM的流程,i是输入,C是记忆,f是遗忘,o是输出,h是隐藏状态,输入门(input gate)确定i的权重,输入调制门(input modulator)确定i对存储器的贡献,遗忘门确定遗忘权重,输出门确定输出权重,模型需要学习这些权重。


LSTM

计算上下文向量Zt:对于每一个特征向量ai,有一个对应的权重αi,它表示位置i产生下一个标题字的概率(硬的随机注意机制)或表示把ai和位置i混合在一起的相对重要性(软的确定注意机制,不太懂,可能不是这个意思)。αi可根据注意模型fatt计算,Zt可根据αi和ai计算,公式如下。



二、硬注意和软注意

硬注意机制和软注意机制是注意模型fatt的替代机制。

硬注意:如果模型将在某位置生成第t个字,那么记这个位置为st。st,i是一个indicator one-hot变量,如果在第i个位置提取出视觉特征,那么令st,i为1。将st作为中间变量,得到一个以{αi}为参数的伯努利分布,且可根据αi可计算出Zt。(猜的,第一个公式的意思可能是位置i接下来生成标题的可能性,第二个公式计算第t个字最有可能在哪个位置生成。)


软注意:(没看懂)


三、实验


用三个数据集测试了四个模型,分别用BLEU和METEOR两种研究标准表示结果。软注意和硬注意模型的表现较好。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,635评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,543评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,083评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,640评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,640评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,262评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,833评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,736评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,280评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,369评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,503评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,185评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,870评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,340评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,460评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,909评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,512评论 2 359

推荐阅读更多精彩内容

  • 转自软件所的张俊林老师 注意力模型最近几年在深度学习各个领域被广泛使用,无论是图像处理、语音识别还是自然语言处理的...
    高斯纯牛奶阅读 3,898评论 0 3
  • 论文地址:https://arxiv.org/pdf/1502.03044.pdf参考代码:https://git...
    xieyan0811阅读 371评论 0 0
  • 1. 前言 本文翻译自《Attention?Attention!》博客 最近几年,注意力——在深度学习社区中,已然...
    Silence_Dong阅读 47,815评论 2 29
  • 久违的晴天,家长会。 家长大会开好到教室时,离放学已经没多少时间了。班主任说已经安排了三个家长分享经验。 放学铃声...
    飘雪儿5阅读 7,524评论 16 22
  • 创业是很多人的梦想,多少人为了理想和不甘选择了创业来实现自我价值,我就是其中一个。 创业后,我由女人变成了超人,什...
    亦宝宝阅读 1,816评论 4 1