《End-To-End Memory Network》阅读笔记

论文链接:http://machinelearning.wustl.edu/mlpapers/paper_files/NIPS2015_5846.pdf

本文提出一个端对端的memory network,是端对端训练的,所以在训练时需要很少的supervision。本文的方法也可以看作是RNNsearch的扩展。


Introduction:

在AI研究中的两个挑战是

1. 构建可以进行多步计算的模型,在qa或完成一个任务中

2. 可以描述序列数据的长期依赖的模型

最近出现的是使用storage和attention,操作这个storage为这些挑战提供了一个方法。storage是一个连续的表示,从storage中读取和写入,通过神经网络建模。

本文提出一个RNN结构的模型,在输出之前循环的从external memory中读取,本文的模型也是一个Memory Network[1]的连续型版本,Memory Network不容易BP,每层都需要supervision。本文的模型可以端对端的训练,有输入-输出。本文的模型同样可以看做是RNNsearch[2]的一个版本,有多个计算步骤。多步的计算可以提高performance


Approach:

输入x1,..., xn,存储在memory中,一个query q,输出a  。

每个xi,q和a都包含来自字典V的象征。模型将x写入到memory中,有一个固定长度的buffer size,然后找到x和q的连续性representation。连续性表示通过多跳处理到输出a。

2.1 Single Layer

单层memory hop:

input memory representation:x1,...,xi,

将xi转换为mi,mi是d维的,使用embedding matrix A,d*V

另一个embedding matrix B,和A维度相同,来embedded query q,获得一个internal state u。

使用embedding space来计算u和每个memory mi的匹配程度,计算内积,然后接一个softmax。


Output memory representation

每个xi都有一个output vector ci,(另一个embedding matrix C),来自memory的reponse vector o是输入ci的求和

从memory拿到的response vector

Generating the final prediction

将output vector o和input embedding u求和,W权重矩阵是V*d的

predicted label

三个embedding matrices A,B 和C,以及W权重矩阵是联合训练的,通过最小化standard cross-entropy loss between predicted label and the true label a。用随机梯度下降训练。


2.2 Multiple Layers

公式4

每层都有自己的embedding matrices Ak,Ck。但是它们是会限制训练并且增加参数个数。

使用两种权重方案:

Adjacent和Layer-wise(RNN-like)

Overall, it is similar to the Memory Network model in [1], except that the hard max operations within each layer have been replaced with a continuous weighting from the softmax.

如果使用Layer-wise方案,模型可以转换为传统RNN,只是将RNN的输出分为internal和external的输出。(感觉这里作者说的很容易帮助理解,太厉害了,还是要多读好论文啊)

Emitting an internal output corresponds to considering a memory, and emitting an external output corresponds to predicting a label.

从RNN的角度,在图1(b)中的u和公式4中的是hidden state,这个模型生成一个internal output p(attention权重,在图1(a)中使用A)。ingest p using C,然后更新隐状态。而与RNN不同的是,在K hops中输出是存储在memory中的,keep these outputs soft, rather than sampling them(懵逼+_+,soft是啥)

The goal in language modeling is to predict the next word in a text sequence given the previous words x.


[1] https://arxiv.org/pdf/1410.3916.pdf

[2] http://web.stanford.edu/class/cs224d/papers/neural_machine.pdf

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,463评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,868评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,213评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,666评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,759评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,725评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,716评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,484评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,928评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,233评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,393评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,073评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,718评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,308评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,538评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,338评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,260评论 2 352

推荐阅读更多精彩内容

  • 2017年初跟着易仁永澄老师一起共读《好好学习》,这是一本个人知识管理的高阶精进指南,永澄老师带领着大家做的第一堂...
    郑国兴阅读 370评论 0 1
  • 冬夜,他坐在草野间空荡的房里,对着一颗桌上红烛,透过那唯一的难遮住寒风的窗子,能清晰的看到不远处灯红酒绿、高楼林立...
    金胜er阅读 191评论 1 1
  • 虽然每天跟自己待在一起的时间最久,但是有时候经常会觉得,我好像对自己的了解并不完整,都是零零碎碎的片段。 作为一个...
    JustYu阅读 286评论 2 1
  • 这种问题,通常出现在添加第三方库文件或者多人开发时。这种问题一般是找不到文件而导致的链接错误。 我们可以从如下几个...
    iOS_Developer阅读 268评论 0 0