随机梯度下降（Stochastic gradient descent）

以线性回归为例：
我们之前的批量梯度下降，当数据量很大的时候，需要频繁读取数据并计算微分，开销很大，占用内存大。

随机梯度下降和批量梯度下降对比：

随机下降法：
1、将所有数据打乱；
2、分成m小份，每一次训练一份，相当于更新一次参数；然后遍历所有的样本就完成了训练。

最后，随机下降将会得到一个接近全局最小值，对于实际应用来说已经足够了。

最后编辑于：2017.12.11 01:34:16

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

梯度下降优化算法综述
转自http://blog.csdn.net/heyongluoyao8/article/details/5247...
扎Zn了老Fe阅读 5,530评论 0赞 10
梯度下降法（Gradient Descent）
转载-刘建平Pinard-www.cnblogs.com/pinard/p/5970503.html 在求解机器学...
商三郎阅读 8,816评论 0赞 2

机器学习算法小结与收割offer遇到的问题
机器学习是做NLP和计算机视觉这类应用算法的基础，虽然现在深度学习模型大行其道，但是懂一些传统算法的原理和它们之间...
在河之简阅读 20,680评论 4赞 65
一元线性回归-梯度下降法
在高数中，我们求解一个函数的最小值时，最常用的方法就是求出它的导数为0的那个点，进而判断这个点是否能够取最小值。但...
耳朵和爪子阅读 9,279评论 2赞 5
我们都要好好的生活
三月，似乎天气还没有回暖的样子。阳光在冷冷的空气中照射着，这个冬天好像特别漫长。前几日看到有关抑郁症的话题，...
看见猫的鱼阅读 2,578评论 0赞 1

赞1赞

赞赏

手机看全文