登录注册写文章

Tips for Deep Learning

Tips for Deep Learning

Tips for Deep Learning

max pooling显然不能微分

Recipe of Deep Learning

image

Do not always blame overfitting, it is not well trained sometime.
判断是否overfitting，要看在training data和testing data上的结果。

image

Vanishing Gradient Problem

sigmoid function会导致Vanishing Gradient Problem。

image

解决：Rectified Linear Unit (ReLU)。理由：计算快；生物上的理由；等同于无穷多的sigmoid叠加；解决梯度消失问题

Maxout

自动学习activation function，所以ReLU是maxout的special cases

image

image

image

image

maxout和max pooling本质上是一样的，所以maxout和max pooling的训练方法一样。

使用Nesterov动量的RMSProp算法

image

image

之前的grad对现在的grad也有一样程度的影响，越久远的grad，影响越小。

image

image

image

image

image

image

image

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

[机器学习入门] 李宏毅机器学习笔记-10 （Tips for Deep Learning；深...
[机器学习入门] 李宏毅机器学习笔记-10 （Tips for Deep Learning；深度学习小贴士） Re...
holeung阅读 916评论 0赞 2
[Deep Learning] 神经网络基础 Foundations
本文是深度学习总结系列的第一篇，主要内容是神经网络的基础知识，最初版本翻译自：Feedforward Nets a...
舒也ella阅读 1,264评论 0赞 33
机器学习英语词汇--3
激活函数（Activation Function）为了让神经网络能够学习复杂的决策边界（decision bou...
630d0109dd74阅读 1,284评论 0赞 1
深度学习的需要了解的一些术语
激活函数（Activation Function）为了让神经网络能够学习复杂的决策边界（decision bou...
御风之星阅读 5,239评论 0赞 8
ResNet论文翻译——中英文对照
声明：作者翻译论文仅为学习，如有侵权请联系作者删除博文，谢谢！翻译论文汇总：https://github.com...
SnailTyan阅读 12,620评论 3赞 13

1赞2赞

赞赏

手机看全文