实战tensorflow使用BN------一坑的泪

对于一个小白，从了解Batch Normalization（后面简称BN）到正确使用BN,可谓路漫漫兮。在此做一个记录。

网上搜索关于BN最多的就是原理推导，相关论文出处。

例如：

http://blog.csdn.net/Fate_fjh/article/details/53375881

https://www.jianshu.com/p/0312e04e4e83

但是这个并不能帮助我们实际的使用，对于需要迅速用起来的伙伴帮助不大。我们工程师相信的是先用起来，再去研究原理！呵呵！

有一些文章介绍的BN层的实现，也有代码示例，但能顺利跑起来的寥寥。因为使用BN不像卷积层那样，写个层的实现就可以了。由于BN层会包含两个可训练参数以及两个不可训练参数，所以涉及到在train代码中如何保存的关键问题，以及在inference代码中如何加载的问题。有相关博客介绍到这一步了，很有帮助。

例如：

https://www.cnblogs.com/hrlnw/p/7227447.html

本以为别人都说这么明白了，抄一抄不是很容易的事情吗。可以上的代码是不能让你正确完成BN功能的。也不知是抄错了，还是别人漏掉了一些关键环节。总之你的moving_mean/moving_variance好像就是不太对。基本上中文网页很难在找到这个问题的解了。

现在你需要搜索的关键字可能要变成BN/参数保存/平均滑动等等了。还好tensorflow的github中有了线索：

https://github.com/tensorflow/tensorflow/issues/14809

https://github.com/tensorflow/tensorflow/issues/15250

可见有很多人确实无法正确使用BN功能，然而最有用的一个issues是：

https://github.com/tensorflow/tensorflow/issues/1122#issuecomment-280325584

在这里，我拼凑成了一个完整能用的BN功能代码，解决了我好久的痛苦，让我兴奋一下。

知识来源于网络，奉献给网络。不敢独享这一成果，再此分享给大家。

-----------------------------------------------------------------华丽的分割线----------------------------------------------------------------------------

整个BN功能的实现需要分三个部分：1.BN层实现；2.训练时更新和完成后保存；3.预测时加载。

1.BN层实现：

如果你接触了一段时间后，这里你至少应该知道BN的三种实现方式了，但是我只成功了其中的一种，希望其他朋友能够补充完善。

def bn_layer(x, scope, is_training, epsilon=0.001, decay=0.99, reuse=None):

"""

Performs a batch normalization layer

Args:

x: input tensor

scope: scope name

is_training: python boolean value

epsilon: the variance epsilon - a small float number to avoid dividing by 0

decay: the moving average decay

Returns:

The ops of a batch normalization layer

"""

with tf.variable_scope(scope, reuse=reuse):

shape = x.get_shape().as_list()

# gamma: a trainable scale factor

gamma = tf.get_variable(scope+"_gamma", shape[-1], initializer=tf.constant_initializer(1.0), trainable=True)

# beta: a trainable shift value

beta = tf.get_variable(scope+"_beta", shape[-1], initializer=tf.constant_initializer(0.0), trainable=True)

moving_avg = tf.get_variable(scope+"_moving_mean", shape[-1], initializer=tf.constant_initializer(0.0), trainable=False)

moving_var = tf.get_variable(scope+"_moving_variance", shape[-1], initializer=tf.constant_initializer(1.0), trainable=False)

if is_training:

# tf.nn.moments == Calculate the mean and the variance of the tensor x

avg, var = tf.nn.moments(x, np.arange(len(shape)-1), keep_dims=True)

avg=tf.reshape(avg, [avg.shape.as_list()[-1]])

var=tf.reshape(var, [var.shape.as_list()[-1]])

#update_moving_avg = moving_averages.assign_moving_average(moving_avg, avg, decay)

update_moving_avg=tf.assign(moving_avg, moving_avg*decay+avg*(1-decay))

#update_moving_var = moving_averages.assign_moving_average(moving_var, var, decay)

update_moving_var=tf.assign(moving_var, moving_var*decay+var*(1-decay))

control_inputs = [update_moving_avg, update_moving_var]

else:

avg = moving_avg

var = moving_var

control_inputs = []

with tf.control_dependencies(control_inputs):

output = tf.nn.batch_normalization(x, avg, var, offset=beta, scale=gamma, variance_epsilon=epsilon)

return output

def bn_layer_top(x, scope, is_training, epsilon=0.001, decay=0.99):

"""

Returns a batch normalization layer that automatically switch between train and test phases based on the

tensor is_training

Args:

x: input tensor

scope: scope name

is_training: boolean tensor or variable

epsilon: epsilon parameter - see batch_norm_layer

decay: epsilon parameter - see batch_norm_layer

Returns:

The correct batch normalization layer based on the value of is_training

"""

#assert isinstance(is_training, (ops.Tensor, variables.Variable)) and is_training.dtype == tf.bool

return tf.cond(

is_training,

lambda: bn_layer(x=x, scope=scope, epsilon=epsilon, decay=decay, is_training=True, reuse=None),

lambda: bn_layer(x=x, scope=scope, epsilon=epsilon, decay=decay, is_training=False, reuse=True),

)

这里的参数epsilon=0.001, decay=0.99可以自行调整。

2.训练时更新和完成后保存：

在训练的代码中增加如下代码:

update_ops = tf.get_collection(tf.GraphKeys.UPDATE_OPS)

with tf.control_dependencies(update_ops):

train = tf.train.AdamOptimizer(learning_rate=lr).minimize(cost)

这个是用于更新参数的。

var_list = tf.trainable_variables()

g_list = tf.global_variables()

bn_moving_vars = [gfor gin g_listif 'moving_mean' in g.name]

bn_moving_vars += [gfor gin g_listif 'moving_variance' in g.name]

var_list += bn_moving_vars

train_saver = tf.train.Saver(var_list=var_list)

这个是用于保存bn不可训练的参数。

3.预测时加载：

# get moving avg

var_list = tf.trainable_variables()

g_list = tf.global_variables()

bn_moving_vars = [gfor gin g_listif 'moving_mean' in g.name]

bn_moving_vars += [gfor gin g_listif 'moving_variance' in g.name]

var_list += bn_moving_vars

saver = tf.train.Saver(var_list=var_list)

ckpt_path =""

saver.restore(sess, ckpt_path)

这样就可以找到checkpoint中的参数了。

现在你可以开心的使用BN了！

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 213,014评论 6赞 492
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,796评论 3赞 386
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 158,484评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,830评论 1赞 285
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,946评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,114评论 1赞 292
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,182评论 3赞 412
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,927评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,369评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,678评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,832评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,533评论 4赞 335
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,166评论 3赞 317
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,885评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,128评论 1赞 267
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,659评论 2赞 362
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,738评论 2赞 351

实战tensorflow使用BN------一坑的泪

1.BN层实现：

2.训练时更新和完成后保存：

3.预测时加载：

推荐阅读更多精彩内容