循环神经网络(RNN)

序列模型

定义:


image.png

类型:语音识别、情感分类、机器翻译


image.png

image.png

image.png

为什么序列模型使用CNN效果不好:


image.png
循环神经网络

定义:


image.png

类型:


image.png
基础循环网络
image.png

image.png

image.png
词的表示

为了让网络理解我们的输入,需要用词进行向量表示


image.png

image.png

image.png

image.png
矩阵运算表示
image.png
交叉熵损失
image.png
时序反向传播算法(BPTT)
image.png

image.png

image.png
梯度消失、梯度爆炸
image.png
RNN总结
image.png

image.png
案例

流程:


image.png

image.png

单个cell的前向传播:


image.png

image.png
所有cell的前向传播
image.png

image.png

image.png

image.png
单个cell的反向传播
image.png

image.png
所有cell的反向传播(p86)
RNN的结构改进
GRU(门控循环单元)
image.png

本质问题解决:


image.png
LSTM(长短记忆网络)
image.png

作用是便于记忆更长距离的时间状态

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容