登录注册写文章

CS231N Lecture10: RNN

CS231N Lecture10: RNN

过去的模型都是一对一的。一对多应用于image captioning。

many-to-one模型，应用于情感分类。

many-to-many模型，机器翻译。

many-to-many模型，video classification on frame level。

1. Sequential processing of non-sequence data

使用一系列"glimpses"进行图像分类，我的理解是对于每个数字，从一个点开始做一条连续的曲线组成这个数字，而glimpses用于捕捉各个时间点上的信息。

RNN就是要计算一个函数：

计算递归关系

Vanilla RNN

Encoder-Decoder：

Character-level Language Model：

生成文本的过程：根据h去预测下一个字符，接着该字符作为输入。

Backpropagation through time：

截断反向传播：

生成图片标题：

有一个起始的token，例如<START>，给生成隐藏状态的公式增加v的计算。增加第三个权重矩阵。然后将生成的y0作为输入继续计算。直道sample到结束符号<END>。有监督的训练。但是效果不是特别理想

增加Attention：

每次生成的是两个分布，一个是基于图片位置的分布，一个是基于词典的分布。

RNN的其他变形：

Vanilla RNN的梯度：

首先会流向tanh门，接着到权重矩阵。然而在时间纬度上的梯度传递会有问题：

使用gradient clipping来解决梯度爆炸。对于梯度消失，则需要修改RNN的结构---LSTM。

LSTM：

梯度传递：

cell状态的梯度传递只和f(forget gate)相关，而和W没有关系。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

CRNN论文翻译——中英文对照
文章作者：Tyan博客：noahsnail.com | CSDN | 简书翻译论文汇总：https://gith...
SnailTyan阅读 10,055评论 0赞 8
深度学习的需要了解的一些术语
激活函数（Activation Function）为了让神经网络能够学习复杂的决策边界（decision bou...
御风之星阅读 5,245评论 0赞 8
已经离开，为何还要回头？
这是《将朋友圈设置分组已经out了……》的第二篇。这是木子离开柔儿的第二年。这两年的时间里面，柔儿从失恋时的痛...
金宝鸭梨阅读 619评论 1赞 0
我爸妈不同意我跟你谈恋爱
这世界上的男欢女爱，痴怨纠缠，红尘纷扰。我听过很多男男女女的情感咨询，从他们的故事里我总结出一句话：他们从来没有...
乔诗伟阅读 1,331评论 10赞 17
伯诚读西游-乱蟠桃大圣偷丹，反天宫诸神捉怪。（下）
赤脚大仙说了什么呢？ “臣蒙王母诏见昨日赴会，偶遇齐天大圣，对臣言万岁有旨，着他邀臣等先赴通明殿演礼，方去赴会。”...
伯诚阅读 534评论 0赞 2

赞1赞

赞赏

手机看全文