1
2
1759
3
与 《Knowing When to Look: Adaptive Attention via A Visual Sentinel for Im...
Motivation plain的RNN存在梯度消失与爆炸问题,而LSTM/GRU虽然一定程度解决了问题,但是由于采用tanh或者sigmoid...