登录注册写文章

《Incorporating copying mechanism in sequence-to-sequence learning》阅读笔记

《Incorporating copying mechanism in sequence-to-sequence learning》阅读笔记

论文来源：http://www.aclweb.org/anthology/P/P16/P16-1154.pdf

从输入句中选择性的复制certain segments到输出句中。

本文：encoder-decoder 结合了copying机制，称为COPYNET。 text summarization tasks

copynet

Encoder：将source sequence转换成隐状态，每个隐状态ht与单词wt相关联。source序列的表示为{h1,....hTs} 作为M

Decoder：一个RNN读取M然后预测目标序列。创新点在于：1. Prediction：通过两个modes的mixed概率来预测单词：generate-mode和copy-mode，后者从source序列中挑选词 2. State Update：以前t-1的词用来更新t的状态，但是copynet只使用word-embedding同时也联系其在M中的位置信息。 3. Reading M：“selective read” to M

下面分别介绍这三点：

1. 通过copying和generation来预测：

词汇： vocabulary V， out-of-vocabulary(OOV) 为UNK，所有unique words 在source sequence中的 X。。。所有词汇为三个的并集 V U UNK U X

generate-mode和copy mode

这两个mode的概率分别为：

两个mode的概率

打分方程，和归一化

打分函数分别为：

score

2. state update

yt-1 用如下形式表示：

yt-1

我的理解： e(yt-1)是word embedding，后者是将yt-1的一些信息与M相关联起来，与source text中的词和词的位置都相关。如果yt-1没有在source text中，将后者设置为0

3. hybrid addressing of M

content-based and location-based

最后编辑于：2017.12.11 05:28:13

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

《Paraphrase Generation with Deep Reinforcement ...
论文链接：paper （......paraphrase翻译成中文不知道是不是这个：释义，这篇博客都用的这个来表示...
best___me阅读 7,775评论 1赞 4
无标题文章
不么
裤腿阅读 1,076评论 0赞 0

登岳阳楼怀文正公
逐波宦海遇寒流，文正却无迁客愁。天下兴亡事关己，谁人能悟岳阳楼？（平水韵、新韵两可，2017-06-18）
西江古月阅读 3,258评论 2赞 5
《物业之争》｜8月第十八次分享
分享书目：《物业之争》，今日共分享案例3个，分别是案例51—54，读书收获如下：案例51：《难收的代收代缴费》...
秀丽有约阅读 1,220评论 0赞 1
如果穿越时空，回到北宋汴京
如果能够穿越时空回到过去，你曾幻想可以梦回大唐，尽情畅享开唐盛世的繁华气息；或者神回大清，感受康乾盛世的的兴旺繁荣...
希拉李阅读 8,574评论 34赞 45

友情链接更多精彩内容

赞1赞

赞赏

手机看全文