面试题:批量梯度下降和随机梯度下降法的缺点

https://www.jianshu.com/p/d7d06edb7061


背景

    批量梯度下降法(batch gradient decent)就是我们平时所说的梯度下降,也就是梯度下降过程中,每次更新使用了所有的训练数据,最小化损失函数,找到局部最小值。

当样本量很大的时候,那么更新速度会变慢。假如每次我们只取一个样本更新,这样速度就会快很多。我们每次只取一行样本计算,当成是搜索的方向。

问题解答

批量梯度下降  

a)采用所有数据来梯度下降。  

b)批量梯度下降法在样本量很大的时候,训练速度慢。  

随机梯度下降  

a)随机梯度下降用一个样本来梯度下降。  

b)训练速度很快。  

c)随机梯度下降法仅仅用一个样本决定梯度方向,导致解有可能不是全局最优。  

d)收敛速度来说,随机梯度下降法一次迭代一个样本,导致迭代方向变化很大,不能很快的收敛到局部最优解。  

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容