Show, Attend and Translate: Unsupervised Image Translation with Self-Regularization and Attention 解读

本文提出了一种结合Attention机制和self-Regularization的无监督图像域转换模型。

问题

为了解决两个域间的图像转换问题,需要学习从一个域到另一个域的映射,将X域中的图像转换到Y域。
本文的目的是使生成的图像看起来和源图像(X域)是相似的,同时具备Y域图像的特征。


如上图所示,图像从Horse域转换到了Zebra域,但是背景部分并没有变化。


方法

由于现在的图像转换方法经常会对图像作一些多余的修改,于是作者提出加入一个attention模型来预测一个attention map来指导图像转换。

模型结构如上图所示。
生成器G包含了两个部分,常见的生成器G-0和attention部分G-attn。
G-0负责将输入图像x转换到Y域,G-attn负责预测一个 attention mask。其中G-attn(x)和x同纬度,并且每个像素点都是一个0-1的概率值。
最后在根据G-attn(x)将x,G-0(x)相加得到G(x),之后会具体介绍是怎么加的。


Loss


生成器loss

其中


G-attn(x)即attention mask表示每个像素需要attend的概率,G-attn(x)G-0(x)就从转换过后的图像中取出attend的部分(前景),(1-G-attn(x))x就从原图像中得到了不被attend的部分(背景),将两者加起来就得到了最后的输出。
再回到本文的生成器loss,loss由两部分构成对抗loss L-adv和自正则化loss L-reg。


判别器loss

判别器loss就是常见的GAN中的判别器loss


同样生成器loss L-adv就是



自正则化loss Self-regularization loss

加入自正则化可以使生成的图像和原图保持视觉上的相似,即保留原图的低纬特征。例如 颜色,性质,轮廓等。
自正则化被定义为最小化生成图像和原图的距离,这个距离可以是L1,L2或者SSIM等。
所以生成器L-reg定义为



F是在IMageNet上预训练的VGG网络,用来提取特征。
其中H和W表示不同层,即在多层上做自正则化。
作者提出取前三层能取到最好的效果,并且w1,w2,w3分别取1.0/32,1.0/16,1.0/8。


训练方式

首先单独训练G-0
保持G-0不动,训练G-attn
jointly fine-tune G-0和G-attn


Adaptive weight induction

生成器loss中L-reg前面有一个 λ,一般这个都是作为超参数手工设置的,本文作者采用了一种自适应的方法。
首先设置 λ为0
之后逐步增大 λ
当对抗loss 降低到某个值过后停止增大 λ
继续训练直到收敛
作者说这种方式能够找到较好的 λ,但是原因没有说的很清楚。


具体实现

G-0

由三部分组成,下采样,残差块,上采样层
前部分下采样层 包括两个卷积 stride为2
中间部分是 9个残差块 保持height/width不变
末尾部分 两个反卷积 stride为2
每个卷积后面都跟了 batch normalization和Relu


G-attn

G-attn由初始VGG(取到conv3_3)构成,然后跟了两个分卷积,最后是一个卷积和sigmoid。


Discriminator

5层卷积
前三层stride为2后两层为1
输出是一个判断real/fake的向量


更多细节请看论文地址
目前代码还没有开源出来。

Results

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 227,818评论 6 531
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 98,185评论 3 414
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 175,656评论 0 373
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 62,647评论 1 309
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 71,446评论 6 405
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 54,951评论 1 321
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 43,041评论 3 440
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 42,189评论 0 287
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 48,718评论 1 333
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 40,602评论 3 354
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 42,800评论 1 369
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 38,316评论 5 358
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 44,045评论 3 347
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 34,419评论 0 26
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 35,671评论 1 281
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 51,420评论 3 390
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 47,755评论 2 371

推荐阅读更多精彩内容

  • 1. 关于诊断X线机准直器的作用,错误的是()。 (6.0 分) A. 显示照射野 B. 显示中心线 C. 屏蔽多...
    我们村我最帅阅读 10,726评论 0 5
  • 文章作者:Tyan博客:noahsnail.com | CSDN | 简书 声明:作者翻译论文仅为学习,如有侵权请...
    SnailTyan阅读 1,953评论 0 2
  • 整理了一下实现QQ好友列表的功能,数据也是自己手动拼接模拟的QQFriend 存储好友数据信息 QQFriendG...
    MJBaby阅读 743评论 0 0
  • 我们搬到出租房居住。有一天在窗台下看到一只母猫,在给四只小猫喂奶。那四只小猫很可爱,两只毛色灰的,一只白的,还有一...
    三零三阅读 205评论 0 0
  • 属于我的小公告是什么呢?本来就打算写一个类似于宣言的东西,以便于我可以在光天化日之下来约束我自己,可惜呢,力度总是...
    编者唯阅读 208评论 0 0