深度学习中的优化以及优化算法

直接优化

直接对参数theta求导即可得最优解的形式


什么是凸函数?

如何根据表达式判断一个函数是凸函数?

求二阶偏导数,如果这个二阶偏导数矩阵是半正定的,那么这个函数就是一个凸函数



迭代法

一阶优化方法:梯度下降

梯度下降法

二阶优化方法:牛顿法

牛顿法

牛顿法求解零点

一些其他方法

image.png

梯度下降法与随机梯度下降

image.png

引入随机梯度下降

因为我们的目的是使得训练数据在目标函数上的平均损失最小,但是训练数据一般都很大,每次都计算所有数据的损失函数求平均代价太多,所以我们改变了目标函数,在单次训练的时候目标为让这个batch内的所有数据平均损失最小。


随机梯度下降


mini-batch 梯度下降
加入动量
image.png
AdaGrad
image.png

image.png
Adam

据说ε参数很重要,许多任务上从默认的1e-8改成1的效果很好




其他优化算法

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 不同图像灰度不同,边界处一般会有明显的边缘,利用此特征可以分割图像。需要说明的是:边缘和物体间的边界并不等同,边缘...
    大川无敌阅读 14,121评论 0 29
  • 转载-刘建平Pinard-www.cnblogs.com/pinard/p/5970503.html 在求解机器学...
    商三郎阅读 3,611评论 0 2
  • 深度学习(花书) 第一章 前言 本章节描述了深度学习的发展历史,应用前景,发展趋势,粗略的介绍机器学习如何有别于软...
    迷途的Go阅读 788评论 0 1
  • 我今年七岁,刚刚上一年级,在班里认识赵子硕,在我的后面,时间长了,成了我的好朋友。
    王子炎的妈妈阅读 255评论 0 1
  • 2018-08-03 c6_李晓红Dorothy 2018-08-03 15:38 · 字数 269 · 阅读 0...
    D6_李晓红Dorothy阅读 143评论 0 0

友情链接更多精彩内容