TensorFlow 同时导入多个预训练模型进行 finetuning

        这篇文章将说明怎么同时导入多个预训练模型进行训练。

        前面的文章 TensorFlow 使用预训练模型 ResNet-50 介绍了怎么导入一个单模型预训练参数对模型进行 finetune,但对一些复杂的任务,可能需要对多个模型进行组合,比如如下的模型并行:

双模型并行

或者模型级联:
双模型级联

这个时候就需要一次导入多个预训练模型参数,然后进行训练。

        现在来看多模型并行的情况(多模型级联一样),以双模型并行为例。仍然沿用文章 TensorFlow 使用预训练模型 ResNet-50 的代码,首先定义模型结构,只需要修改 model.py 中的 predict 函数(以 ResNet-50VGG-16 双模型为例):

    def predict(self, preprocessed_inputs):
        """Predict prediction tensors from inputs tensor.
        
        Outputs of this function can be passed to loss or postprocess functions.
        
        Args:
            preprocessed_inputs: A float32 tensor with shape [batch_size,
                height, width, num_channels] representing a batch of images.
            
        Returns:
            prediction_dict: A dictionary holding prediction tensors to be
                passed to the Loss or Postprocess functions.
        """
        # ResNet-50
        with slim.arg_scope(nets.resnet_v1.resnet_arg_scope()):
            net_resnet, _ = nets.resnet_v1.resnet_v1_50(
                preprocessed_inputs, num_classes=self.num_classes,
                is_training=self._is_training)
            net_resnet = tf.squeeze(net_resnet, axis=[1, 2])
            
        # VGG-16
        with slim.arg_scope(nets.vgg.vgg_arg_scope()):
            net_vgg, _ = nets.vgg.vgg_16(
                preprocessed_inputs, num_classes=self.num_classes,
                is_training=self._is_training)
            
        logits = tf.add(net_resnet, net_vgg)
        prediction_dict = {'logits': logits}
        return prediction_dict

然后在项目中添加如下文件(命名为:model_utils.py):

# -*- coding: utf-8 -*-
"""
Created on Thu Nov 29 11:36:07 2018

@author: shirhe-lyh


Modified from:
    1.https://github.com/tensorflow/models/blob/master/research/maskgan/
        model_utils/model_utils.py
    2.https://github.com/tensorflow/models/blob/master/research/maskgan/
        train_mask_gan.py
"""

import tensorflow as tf

flags = tf.app.flags

FLAGS = flags.FLAGS


def retrieve_init_savers(var_scopes_dict=None, 
                         checkpoint_exclude_scopes_dict=None):
    """Retrieve a dictionary of all the initial savers for the models.
    
    Args:
        var_scopes_dict: A dictionary of variable scopes for the models.
        checkpoint_exclude_scopes_dict: A dictionary of comma-separated list of 
            scopes of variables to exclude when restoring from a checkpoint.
        
    Returns:
        A dictionary of init savers.
    """
    if var_scopes_dict is None:
        return None
    
    
    # Dictionary of init savers
    init_savers = {}
    for key, scope in var_scopes_dict.items():
        trainable_vars = [
            v for v in tf.trainable_variables() if v.op.name.startswith(scope)]
        
        exclusions = []
        checkpoint_exclude_scopes = checkpoint_exclude_scopes_dict.get(
            key, None)
        if checkpoint_exclude_scopes:
            exclusions = [scope.strip() for scope in 
                         checkpoint_exclude_scopes.split(',')]
        variables_to_restore = []
        for var in trainable_vars:
            excluded = False
            for exclusion in exclusions:
                if var.op.name.startswith(exclusion):
                    excluded = True
            if not excluded:
                variables_to_restore.append(var)
        
        init_saver = tf.train.Saver(var_list=variables_to_restore)
        init_savers[key] = init_saver
    return init_savers


def init_fn(init_savers, sess):
    """The init_fn to be passed to the Supervisor.
    
    Args:
        init_savers: Dictionary of init_savers in the format:
            'init_saver_name': init_saver.
        sess: A TensorFlow Session object.
    """
    # Load the weights for ResNet
    if FLAGS.resnet_ckpt:
        print('Restoring checkpoint from %s.' % FLAGS.resnet_ckpt)
        tf.logging.info('Restoring checkpoint from %s.' % FLAGS.resnet_ckpt)
        resnet_init_saver = init_savers['ResNet']
        resnet_init_saver.restore(sess, FLAGS.resnet_ckpt)
        
    # Load the weights for VGG
    if FLAGS.vgg_ckpt:
        print('Restoring checkpoint from %s.' % FLAGS.vgg_ckpt)
        tf.logging.info('Restoring checkpoint from %s.' % FLAGS.vgg_ckpt)
        vgg_init_saver = init_savers['VGG']
        vgg_init_saver.restore(sess, FLAGS.vgg_ckpt)
        
    if FLAGS.resnet_ckpt is None and FLAGS.vgg_ckpt is None:
        return None

最后,用如下代码替换 train.py 中的 get_init_fn 函数(需要增加导入语句:import model_utils.py,以及 from functools import partial):

def get_init_fn():
    """Returns a function run by che chief worker to warm-start the training.
    
    Returns:
        An init function run by the supervisor.
    """
    var_scopes_dict = {'ResNet': 'resnet_v1_50',
                       'VGG': 'vgg_16'}
    checkpoint_exclude_scopes_dict = {'ResNet': 'resnet_v1_50/logits',
                                      'VGG': 'vgg_16/fc8'}
    init_savers = model_utils.retrieve_init_savers(
        var_scopes_dict, checkpoint_exclude_scopes_dict)
    init_fn = partial(model_utils.init_fn, init_savers)
    return init_fn

其它代码照旧就可以了(此时,batch_size 需要调小才能在 1080Ti 上训练)。

        一次性导入多个预训练模型参数的思路非常简单,首先根据模型变量的命名空间,比如 ResNet-50 的命名空间 resnet_v1_50 以及 VGG-16 的命名空间 vgg_16,借助函数 tf.trainable_variables() 将相应命名空间中的可训练变量列表找出来(同时排除掉不需要的预训练参数);接着就可以用语句 tf.train.Saver(var_list=variables_to_restore) 定义模型保存的实例,然后用这些实例的 restore 函数将预训练参数逐个恢复。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,463评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,868评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,213评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,666评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,759评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,725评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,716评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,484评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,928评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,233评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,393评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,073评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,718评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,308评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,538评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,338评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,260评论 2 352