RNN LSTM BI-LSTM

RNN 循环神经网络

RNN主要处理有时序关系的变长序列问题。每个神经元在每一时刻都一个特殊的hidden状态h(t),由当前节点的输入I(t)和上一时刻t-1隐藏状态h(t-1)加权求和后经过一个非线性激活函数得到,具体表示成公式如下:


每个神经元t时刻隐状态


参数Whh决定了当前神经元以多少比例接受之前所有时刻[0,t-1]的输入信息

阻碍RNN发展的两个严重问题是:梯度爆炸 和 梯度消失、

RNN的对隐状态h(0)进行反向传播:


利用RNN时序上的依赖关系对上式\frac{\delta l}{\delta h_{t} } 进行展开,得到(注意,下式成立的前提是激活函数简化为线性函数):

\frac{\delta h_{t}}{ \delta h_{0}} = \prod_{i=1}^t \frac{\delta h_{i}}{ \delta h_{i-1}} = \prod_{i=1}^t W_{hh} = W_{hh}^t

继续对W_{hh}^t 进行矩阵奇异值分解(SVD):

W_{hh} = U\Sigma ^t V^\top = \sum_{i=1}^r \sigma _{i}^t u_i v_i^\top

因此最后要计算的目标为:

\frac{\delta l}{\delta h_0} =  (\frac{\delta l}{\delta h_0})^\top \frac{\delta l}{\delta h_t} = (\sum_{i=1}^r \sigma _{i}^t u_i v_i^\top)^\top \frac{\delta l}{\delta h_t}  = \sum_{i=1}^r \sigma _{i}^t v_i u_i^\top \frac{\delta l}{\delta h_t}

如果时间序列较长,W_{hh}的奇异值如果>1,t个\sigma _i连乘后会非常大,反之则会非常小

基于RNN的这个缺点,引入了LSTM

LSTM (Long-Short-Term-Memory)

LSTM相比RNN其实就是多了一个门(gate)机制和细胞记忆单元(cell-state)用来存储,用来记录信息。

复杂版的LSTM神经元机制

LSTM的化简过程

第一次化简

LSTM中有三个门控单元,i_t,f_t,o_t,因为三者的计算方法都相同,区别只是使用了不同的权重矩阵以便反向传播时对三个门独立更新,因此可以不再特别考虑它们。

输入门、遗忘门、输出门

第二次化简

LSTM对各维度特征的门控单元也是独立更新的,为了简化表示,可以只考虑一维的情况。从一维推广到多维是很直观的。化简到一维后,c_t,h_t最初的公式中向量内积\odot 可以转化成数和向量的乘积\cdot

化简后的cell_state

第三次化简

三个门控单元经过sigmoid变化归一化到了[0,1]区间,因此可以看成是二值输出[0,1],也就是说门控单元可以看成是控制信息流通的开关。

sigmoid函数

用一张图表示

LSTM中的cell_statec_t其实就相当于RNN中的隐藏神经元h_t。为了方便用图表示,调整一下第二次化简中公式的顺序:

化简后的LSTM遗忘机制

由上图可以看出,当i_t=0,h_t=1,o_t=0时,LSTM退化为RNN

各个控制单元的作用

输出门o_{t-1}用于保存c_{t-1}中对h_{t-1}有用的信息

输入门i_t用于判断当前输入x_t是否对context有作用,当i_t=1时,使用x_t作为输入

遗忘门f_t用于判断当前cell_statec_t对上一个cell_satec_{t-1}的依赖程度,当前输入x_t如果依赖上文信息,关闭遗忘门即可。

细胞状态c_t它包含了当前输入x_t和上一时刻细胞状态c_{t-1}的信息,并且由于c_tc_{t-1}之间是“短路连接”(由公式可以看出两者之间是线性关系),因此反向传播时,c_t的梯度可以直接传播给c_{t-1},这也是LSTM能够有效缓解RNN中梯度消失和梯度爆炸的关键。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 221,576评论 6 515
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,515评论 3 399
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 168,017评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,626评论 1 296
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,625评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,255评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,825评论 3 421
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,729评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,271评论 1 320
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,363评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,498评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,183评论 5 350
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,867评论 3 333
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,338评论 0 24
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,458评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,906评论 3 376
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,507评论 2 359

推荐阅读更多精彩内容