10
0
1
250
梯度消失/梯度爆炸 主要出现在sigmoid函数中,靠近输出层的hidden layer 梯度大,参数更新快,所以很快就会收敛; 而靠近输入层的hidden layer 梯度...
写了 114104 字,被 107002 人关注,获得了 3738 个喜欢
写了 0 字,被 119157 人关注,获得了 8279 个喜欢
写了 262206 字,被 58235 人关注,获得了 1464 个喜欢
写了 0 字,被 47254 人关注,获得了 1001 个喜欢
写了 7799002 字,被 518562 人关注,获得了 7797 个喜欢
写了 0 字,被 643141 人关注,获得了 74459 个喜欢
写了 10990382 字,被 250863 人关注,获得了 250393 个喜欢
写了 0 字,被 129203 人关注,获得了 1230 个喜欢
写了 10433034 字,被 585014 人关注,获得了 207099 个喜欢
写了 65132 字,被 8990 人关注,获得了 12326 个喜欢