sigmoid 用在了各种gate上,产生0~1之间的值,这个一般只有sigmoid最直接了。
tanh 用在了状态和输出上,是对数据的处理,这个用其他激活函数或许也可以。
逐步了解LSTM
1)决定丢弃信息
决定从细胞状态中丢弃什么信息,需要一个"遗忘门"
2)确定更新信息
确定什么样的新信息被存放在细胞状态中
3)更新细胞状态
4)输出信息
变体GRU
完毕。
sigmoid 用在了各种gate上,产生0~1之间的值,这个一般只有sigmoid最直接了。
tanh 用在了状态和输出上,是对数据的处理,这个用其他激活函数或许也可以。
逐步了解LSTM
1)决定丢弃信息
决定从细胞状态中丢弃什么信息,需要一个"遗忘门"
2)确定更新信息
确定什么样的新信息被存放在细胞状态中
3)更新细胞状态
4)输出信息
变体GRU
完毕。