深层神经网络2


使用验证集判断模型效果

为了评测神经网络模型在不同参数下的效果,一般会从训练集中抽取一部分作为验证数据。除了使用验证数据集,还可以采用交叉验证(cross validation )的方式验证模型效果,但是使用交叉验证会花费大量的时间。但在海量数据情况下,一般采用验证数据集的形式评测模型的效果。
一般采用的验证数据分布越接近测试数据分布,模型在验证数据上的表现越可以体现模型在测试数据上的保险。
使用滑动平均模型和指数衰减的学习率在一定程度上都是限制神经网络中参数更新的速度。
在处理复杂问题时,使用滑动平均模型、指数衰减的学习率和正则化损失可以明显提升模型的训练效果。


变量管理

Tensorflow提供了通过变量名称来创建或者获取一个变量的机制,避免了复杂神经网络频繁传递参数的情况。通过该机制,在不同的函数中可以直接通过变量的名字来使用变量,而不需要将变量通过参数的形式到处传递。
Tensorflow中通过变量名获取变量的机制主要通过tf.get_variable()tf.variable_scope()函数实现。

  1. tf.get_variable()
    该函数创建变量的方法和tf.Variable()函数的用法基本一样,提供维度信息(shape)以及初始化方法(initializer)的参数。该函数的变量名称是一个必填参数,函数会根据这个名字去创建或者获取变量。当已经有同名参数时,会报错。
  2. tf.variable_scope()
    该函数可以控制tf.get_variable()函数的语义。当tf.variable_scope()函数使用参数reuse=True生成上下文管理器时,这个上下文管理器内所有的tf.get_variable()函数会直接获取已经创建的变量。如果不存在,则报错;当reuse=False或者reuse=None创建上下文管理器时,tf.get_variable()操作将创建新的变量,如果同名变量已经存在,则报错。
    同时tf.variable_scope()函数可以嵌套。新建一个嵌套的上下文管理器但不指定reuse,这时的reuse的取值和外面一层保持一致。当退出reuse设置为True的上下文之后reuse的值又回到了False(内层reuse不设置)。

同时,tf.variable_scope()函数生成的上下文管理器也会创建一个Tensorflow中的命名空间,在命名空间内创建的变量名称都会带上这个命名空间名作为前缀。可以直接通过带命名空间名称的变量名来获取其它命名空间下的变量(创建一个名称为空的命名空间,并设置为reuse=True)。

with tf.variable_scope(" ", reuse=True):
     v5 = tf.get_variable("foo/bar/v", [1])
     print(v5.name)
===>v:0   # 0表示variable这个运算输出的第一个结果

Tensorflow模型持久化

将训练得到的模型保存下来,可以方便下次直接使用(避免重新训练花费大量的时间)。Tensorflow提供的持久化机制可以将训练之后的模型保存到文件中。
Tensorflow提供了tf.train.Saver类来保存和还原神经网络模型。当保存模型之后,目录下一般会出现三个文件,这是因为Tensorflow会将计算图的结构和图上参数值分开保存。

  1. model.ckpy.meta文件,保存了Tensorflow计算图的结构。
  2. model.ckpt文件,保存了Tensorflow程序每一个变量的取值。
  3. checkpoint文件,保存了一个目录下所有的模型文件列表。

保存模型
saver = tf.train.Saver()
saver.save(sess, "path/model.ckpt")
加载模型,此时不用进行变量的初始化过程
saver.restore(sess, "path/model.ckpt")
sess.run(result)

为了保存和加载部分变量,在声明tf.train.Saver类时可以提供一个列表来指定需要保存或加载的变量,saver = tf.train.Saver([v1])。同时,tf.train.Saver类也支持在保存或者加载时给变量重命名,如果直接加载就会导致程序报变量找不到的错误,Tensorflow提供通过字典将模型保存时的变量名和要加载的变量联系起来。

v = tf.Variable(tf.constant(1.0, shape=[1]), name='other-v1')
saver = tf.train.Saver({"v1": v})
将原先变量名为v1的变量加载到变量v中,变量v的名称为other-v1。

这样做的目的时为了方便使用变量的滑动平均值。因为每一个变量的滑动平均值是通过影子变量维护的,如果在加载模型时直接将影子变量映射到变量自身,就不需要在调用函数来获取变量的平均值了。

为了方便加载重命名滑动平均变量,tf.train.ExponentialMovingAverage类提供了variables_to_restore()函数来生成tf.train.Saver类所需要的变量重命名字典。

v = tf.Variable(0)
ema = tf.train.ExponentialMovingAverage(0.99)
saver = tf.train.Saver(ema.variable_to_restore())
with tf.Session() as sess:
     saver.restore(sess, "path/model.ckpt")
     sess.run(v)

有时候不需要类似于变量初始化、模型保存等辅助节点的信息,Tensorflow提供了convert_variables_to_constants()函数将计算图中的变量及其取值通过常量的方式保存。


持久化原理及数据格式

Tensorflow程序中所有计算都会被表达为计算图上的节点。

MetaGraphDef

Tensorflow通过元图(MetaGraph)来记录计算图中节点的信息以及运行计算图中节点所需要的元数据,元图是由MetaGraphDef Protocol Buffer定义的,MetaGraphDef中的内容构成了Tensorflow持久化的第一个文件,也就是model.ckpt.meta文件。

  • meta_info_def属性,记录了Tensorflow计算图中的元数据以及Tensorflow程序中所有使用到的运算方法的信息。元数据包括了计算图的版本号以及用户指定的一些标签,其中meta_info_def属性的stripped_op_list属性保存了Tensorflow运算方法的信息,如果一个运算方法在计算图中出现了多次,在该字段中也只出现一次。stripped_op_list属性的类型是OpListOpList类型是一个OpDef类型的列表,该类型定义了一个运算的所有信息,包括运算名、输入输出和运算的参数信息。
  • graph_def属性,主要记录了Tensorflow计算图上的节点信息,Tensorflow计算图的每一个节点对应了Tensorflow程序中的一个运算。meta_info_def属性已经包含了所有运算的具体信息,所以graph_def属性只关注运算的连接结果。
    该属性是通过GraphDef Protocol Buffer定义的,GraphDef主要包含了一个NodeDef类型的列表,GraphDefversions属性存储了Tensorflow的版本号,node属性记录了所有的节点信息。nodeNodeDef类型,该类型的op属性给出了该节点使用的运算方法名称,具体信息可以通过meta_info_def获取,input属性是一个字符串列表,定义了运算的输入,device属性定义了处理该运算的设备,attr属性定义了和当前运算相关的配置信息。
  • saver_def属性,记录了持久化模型所需要用到的一些参数,比如保存到文件的文件名,保存操作和加载操作的名称以及保存频率、清理历史记录等。
    该属性主要通过SaverDef定义。
  • collention_def属性,Tensorflow计算图中可以维护不同的集合,底层实现就是通过collention_def这个属性。collection_def属性是一个从集合名称到集合内容的映射,其中集合名称为字符串,集合内容为CollentionDef Protocol Buffer。Tensorflow计算图上的集合主要可以维护4类不同的集合:NodeList用于维护计算图上的节点集合;BytesList用于维护字符串或者序列化之后的Protocol Buffer的集合;Int64List用于维护整数集合;FloatList用于维护实数集合。
SSTable

持久化Tensorflow中变量的取值,tf.Saver得到的model.ckpt文件保存了所有的变量,该文件使用SSTable格式存储的,相当于一个(key, value)列表。

CheckpointState

持久化的最后一个文件名叫checkpoint,这个文件是tf.train.Saver类自动生成且自动维护的。该文件中维护了一个由tf.train.Saver类持久化的所有Tensoflow模型文件的文件名,当某个模型文件被删除时,这个模型对应的文件名也会被移除,checkpoint中内容的格式为CheckpointState Protocol Buffer

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,634评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,951评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,427评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,770评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,835评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,799评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,768评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,544评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,979评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,271评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,427评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,121评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,756评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,375评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,579评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,410评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,315评论 2 352

推荐阅读更多精彩内容

  • 简单线性回归 import tensorflow as tf import numpy # 创造数据 x_dat...
    CAICAI0阅读 3,545评论 0 49
  • 躺在石头上, 另一块皎洁的漂在空中。 夹在两块石头之中。 如柴房角落里的百脚虫。
    李办蜡阅读 278评论 0 0
  • 前几天在商场选唇彩,却意外被一支洗面奶所吸引。 这支轻巧的洗面奶简单、朴素,毫不起眼,站在众多包装考究的化妆品里,...
    阿兰若素潇雨阅读 294评论 0 1
  • 那是一张我四岁,弟弟不满周岁的照片。母亲在过年之际想用照片记下弟弟不满周岁的样子,所以我们去了照相馆。那时候觉得照...
    爱吃鱼的小白羊阅读 222评论 1 1