登录注册写文章

网络学习率变化策略

网络学习率变化策略

学习率变化有以下几种常见策略：

base_lr是基础学习率，这里设置为0.1。

1）“step” - 需要设置一个stepsize参数，返回base_lr * gamma ^ ( floor ( iter / stepsize ) )，iter为当前迭代次数，gamma设置为0.4，stepsize设置100；

2）“multistep” 和step相近，但是需要stepvalue参数，step是均匀等间隔变化，而multistep是根据stepvalue的值进行变化；

3）“fixed” - 保持base_lr不变；

4）“exp” - 返回base_lr * gamma ^ iter, iter为当前迭代次数，gamma设置为0.98；

5）“poly” - 学习率进行多项式误差衰减，返回 base_lr* ( 1 - iter / max_iter ) ^ ( power )，power设置为0.9；

6）“sigmoid” - 学习率进行sigmod函数衰减，返回 base_lr ( 1/ 1＋exp ( gamma * ( iter - stepsize ) ) )，gamma设置为0.05，stepsize设置为200；

最后编辑于：2017.12.04 21:32:56

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Caffe学习笔记4：特殊的层及solver最优化求解
今天总结一下搜到的一些知识：感谢卷积神经网络（CNN）中的一些特殊层 Batch Normalization D...
Zz鱼丸阅读 7,237评论 0赞 1
Caffe最优求解过程及I/O模块
Google Openimages Dataset 1. Caffe最优求解过程 1.1 Solver介绍 Caf...
sixfold_yuan阅读 4,788评论 0赞 0
Caffe solver配置
solver算是caffe的核心的核心，它协调着整个模型的运作。caffe程序运行必带的一个参数就是solver配...
陈继科阅读 5,276评论 0赞 3
Caffe的solver参数介绍
文章作者：Tyan博客：noahsnail.com | CSDN | 简书 1. Parameters solve...
SnailTyan阅读 4,245评论 0赞 0
caffe入门应用方法(二)——solver超参数配置文件
caffe入门应用方法(二)——solver超参数配置文件在文章caffe入门应用方法(一)——网络层参数配置解...
RobertY阅读 5,211评论 0赞 0

1赞2赞

赞赏

手机看全文