登录注册写文章

Caffe的BN参数转移到PyTorch上

Caffe的BN参数转移到PyTorch上

Caffe的模型参数转移到PyTorch上，最需要注意的是Caffe中的BN层+Scale层与PyTorch中BN层区别，理解之后BN层参数转移很简单。

也可以参考GitHub代码：pytorch-caffe

Batch Normalization

Caffe的BN+Scale等于PyTorch的BN，二者都可以用上述公式表达。

在Caffe中，BN层负责计算均值E和方差Var；Scale层进行归一化，包含两个参数λ和β。
BN层参数:

message BatchNormParameter {
  // 当为真，使用保存的均值和方差，否则使用滑动平均计算新的方差和均值
  optional bool use_global_stats = 1;
  //滑动平均的系数
  optional float moving_average_fraction = 2 [default = .999];
  // 平滑，防止除以0
  optional float eps = 3 [default = 1e-5];
}

BN层有三个参数保存：均值E、方差Var、滑动系数；Scale层保存两个参数：λ和β。

在PyTorch中，BN层定义：

class _BatchNorm(Module):
# eps防止除以0
# momentum 滑动平均的系数(实际代码中等价于caffe中的 0.999)
# affine是否归一化
# track_running_stats等价于Caffe中的use_global_stats
    def __init__(self, num_features, eps=1e-5, momentum=0.1, affine=True,
                 track_running_stats=True):

BN层中保存四个参数：均值running_mean、方差running_var、权重weight、偏置bias。

BN层参数从Caffe转换到PyTorch

发现Caffe中的BN层参数有5个，而PyTorch中只有四个，多出一个滑动系数。参考pytorch-caffe的做法，是把Caffe中的均值和方差先除以滑动系数，再转到PyTorch中。例如：

注意点

在Caffe中训练时设置use_global_stats=false，测试时需要改为use_global_stats=true。
在PyTorch中model.train()默认track_running_stats=true,测试时model. eval()默认track_running_stats=false。

最后编辑于：2019.12.13 20:40:12

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Pytorch中的BatchNorm2d的参数解释
参考链接：https://www.cnblogs.com/leebxo/p/10880399.html Batch...
顾北向南阅读 23,724评论 4赞 3
cs231n学习笔记-激活函数-BN-参数优化
cite from: http://blog.csdn.net/myarrow/article/details/5...
江州司马binbin阅读 9,077评论 1赞 8
Dive into Deep Learning
# Basics ## Standard notations- Variable: $X$ (uppercase ...
一只叫kevin的蓝精灵阅读 1,640评论 0赞 0
BN Batch Normalization
【转：郭耀华】https://www.cnblogs.com/guoyaohua/p/8724433.html p...
默写年华Antifragile阅读 580评论 1赞 0
深度学习中训练参数的调节技巧
深度学习中训练参数的调节技巧在这篇文章中： 2、权重 3、层数 4、过拟合 5、Loss设计与观察二、caff...
裁尘的人儿阅读 3,834评论 0赞 0

1赞2赞

赞赏

手机看全文