序列模型
定义:
类型:语音识别、情感分类、机器翻译
为什么序列模型使用CNN效果不好:
循环神经网络
定义:
类型:
基础循环网络
词的表示
为了让网络理解我们的输入,需要用词进行向量表示
矩阵运算表示
交叉熵损失
时序反向传播算法(BPTT)
梯度消失、梯度爆炸
RNN总结
案例
流程:
单个cell的前向传播:
所有cell的前向传播
单个cell的反向传播
所有cell的反向传播(p86)
RNN的结构改进
GRU(门控循环单元)
本质问题解决:
LSTM(长短记忆网络)
作用是便于记忆更长距离的时间状态