登录注册写文章

RNN中的GRU门

RNN中的GRU门

传统RNN网络中的梯度下降现象会导致RNN的记忆能力并不太好。为了使得RNN网络能够记得更久以前的信息，就有了GRU（gated recurrent unit）。GRU使得信息可以直接从过去流到现在，而不需要经过连续的矩阵作用。

我们在这里以tanh-RNN为例来说明，传统的网络更新流程如图Fig 0所示。

Fig 0

但是GRU采用的策略如Fig1所示。

Fig 1

首先我们在h中选择一个子集，这个子集经过传统的tanh作用后，我们得到h'，数学形式如Fig 2中所示。

Fig 2.

那么r(eset)这个值该怎么决定呢？

Fig 3

r决定了h中哪些元素在产生h'的时候起作用。但是这里仍然不是最后的updata，最后的update如图Fig 4所示。

Fig 4.

u是update gate，它的定义如图Fig 5所示。

Fig 5.

最后编辑于：2017.12.10 05:06:09

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

CRNN论文翻译——中英文对照
文章作者：Tyan博客：noahsnail.com | CSDN | 简书翻译论文汇总：https://gith...
SnailTyan阅读 10,190评论 0赞 8
[NL系列] RNN & LSTM 网络结构及应用
这篇是 The Unreasonable Effectiveness of Recurrent Neural Ne...
ToeKnee阅读 26,810评论 5赞 89
深度学习的需要了解的一些术语
激活函数（Activation Function）为了让神经网络能够学习复杂的决策边界（decision bou...
御风之星阅读 5,303评论 0赞 8
午餐便当Day 8: 黑豆饭+香菇青椒炒肉+香蕉/胡萝卜
午餐便当的第七天，周四，黑豆饭和菌类菜日。今天的主食是黑豆饭，黑豆提前泡好，然后加入洗净的米中一起煮。黑豆饭不如...
potatomatoer阅读 616评论 2赞 1
为了什么
现在的我总在想活着到底是为了什么。活着到底是为了什么？金钱？权利？现在的我越来越迷茫。有的人说活着是为了梦想...
一月的雪阅读 328评论 0赞 0

赞1赞

赞赏

手机看全文