自然语言处理—GRU

GRU

GRU 动机

大家可以关注我在西瓜视频 zidea 的账号,图标与本人简书图标一致,来收看相关视频

因为在循环神经网络中存在循环结构,所以反向传播计算中,梯度很容易出现梯度弥散和梯度爆炸的情况,可以梯度裁剪可以防止梯度爆炸,对于梯度弥散我们可以采用几种措施

策略
增加数据量
  • 增加数据量
改变神经网络结构
  • 改变神经网络结构

改变神经网络结构

之前我们介绍的 LSTM 就是为了解决梯度消失问题而提出的门控循环神经网络(gated recurrent networks)的一种,今天我们将介绍除了 LSTM 以外,另一种门控循环神经网络 GRU。

059.jpg

GRU 结构相对于 LSTM 要简单一些。GRU 是在 2014 年由 Cho、van Merrienboer、Bahdanau 和 Bengio 提出的。

GRU 首秀

如何实现门控机制

门控

其实门控机制是 GRU 特点,那么又是如何实现门控机制的呢? 其实这个并不难,是否还记得在 logistic 回归的 sigmoid 函数,这个函数性质就是将线性输出实数域压缩到 0 到 1 之间数值,所以我们通过用 sigmoid 函数包裹输入的线性变换和上一个隐含状态就实现一个门控

gru_002.png

重置门和更新门

在 GRU 结构中主要有两个门分别是重置门和更新门,下图就是GRU 的结构

gru_001.png

\begin{aligned} R_t = \sigma(X_tW_{xr} + H_{t-1}W_{hr} + b_r)\\ Z_t = \sigma(X_tW_{xz} + H_{t-1}W_{hz} + b_z)\\ \end{aligned}

R_t重置门(reset gate),Z_t更新门(update gate)
X_t 表示在 t 时刻的输入
H_{t-1} 表示上一个时刻隐含状态

  • 候选隐含状态: 在 GRU 同样维护一个候选隐含状态
  • 重置门: 有助于捕捉时序数据中短期的依赖关系
  • 更新门: 有助于捕捉时序数据中长期的依赖关系

通过输入和上一个时刻隐含状态来控制重置门,是否将候选隐含状态中信息抛弃来实现遗忘作用,更新门用来控制是否将当前输入以及上一时刻隐含状态信息更新到候选隐含状态

\tilde{H}_t = \tanh (X_tW_{xh} + R_t \odot H_{t-1}W_{hh} + b_h)

  • \odot 表示按元素相乘
  • H_{t-1} 是 t-1 时刻隐含状态,所以比较直观理解,当R_t是一个标量,非常接近 0 的数,那么其实就把上一个时刻信息丢弃掉;,如果R_t 表示会将过去信息保留,也就是控制是否保留过去信息。
011.png

这里选择 tanh 将输出压缩到 -1 和 1 之间好处也是便于计算

为什么 GRU 会有效

效率

我们是通过抛弃一些信息来进行语义分析或者一些语言任务,一些信息对于当前任务可能用处不大,大家可以看下面图,我们模型通过序列,来理解作者的意图,抓住主要含义

005.png

我们人类阅读上面话,会保留能够反应作者主要意图的词语或者句子,其他词语可能对我们理解作者意图帮助并不大,所以可以将这些信息量不大词是可以抛弃的。正是因为这一点我们才可以通过门控对记忆不同时刻进行重置和更新

006.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容