LSTM分析

LSTM的作用,背景不多说了,直接介绍下我对LSTM的总结。

3个控件

LSTM单元包含三个控件

1 遗忘门:
image.png

由当前输入数据、上一时刻的隐藏状态(输出)一起做全连接并使用sigmoid制作出来。其负责与记忆细胞做元素乘确定哪些信息保留继续往后传导。
2 输入门:由当前输入数据、上一时刻的隐藏状态(输出)一起做全连接并使用sigmoid制作出来。其与候选记忆细胞做元素乘确定哪些新信息加入记忆细胞。
3 输出门:由当前输入数据、上一时刻的隐藏状态(输出)一起做全连接并使用sigmoid制作出来。其与经过遗忘门,和加入新信息之后的记忆细胞做元素乘确定哪些信息作为当前时刻的输出。
其实三种门的结构是一样的,不同的是全连接和bias不同。


image.png

图片来源于gluon动手学习深度学习文档

2个信息部件

1 记忆细胞,负责从始至终信息的承载。
2 候选记忆细胞,负责承载当前时刻的所有信息。候选记忆细胞由隐藏状态和当前输入 经过全连接之后,通过tanh得到。

6种操作

1、sigmoid
2、tanh
3、multiply元素乘
4、元素加
5、concat (合并)
6、copy

3个状态部件

1 上一时刻输出ht-1,
2 当前时刻输入xt

总结:

1 门需要通过sigmoid函数制造出来。
2 信息的进出需要通过tanh函数的转化(不知道为什么,个人猜测是想利用tanh将信息压缩至[-1,1],不至于数值太过于发散)。
3 对信息进行筛选通过sigmoid之后的tensor和记忆细胞做元素乘实现,取出多少比例就代表保留多少信息。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 嘘 侧耳倾听 今天的夜晚多么静谧 一场小雨 洗涤了连月以来的燥热 雨后的彩虹绚烂地挂在天边 远方的天空被照的通红 ...
    瑾瑜菇凉阅读 235评论 0 0
  • 管理者的三要素:1.必须是知识工作者2.必须有执行力,并且能够推行下去3.对组织产生影响 三个问题:1.你认为自己...
    一米_MsYan阅读 755评论 0 1
  • 迟到的春天 作者:宋永基 泗河在柔风里变幻着体态 她给柳眼一个圆满的期待 大山不再裹紧瘦削的胸怀 天空拧干的水分又...
    孔孟之乡阅读 267评论 0 1