论文笔记TextureGAN: Controlling Deep Image Synthesis with Texture Patches

文章来源:CVPR  2018

下载链接:Paper Download


解决的问题:

纹理合成(纹理传播,即将纹理patch传播至整个object)

通过控制草图、颜色、纹理来合成人们所期望的图像,而以往的图像合成方法仅通过草图和彩色笔画来控制图像合成。本文主要基于纹理进行图像合成。


文章内容

本文方法允许用户在草图的任意位置和以任意比例放置纹理贴图,以控制所需的输出纹理。

在过去的两年中,不使用传统渲染管道直接进行图像合成的想法得到了广泛的关注,因为在诸如变分自编码器(VAEs)和生成对抗网络(GANs)等深层网络架构中获得了很好的结果。然而,在深度图像合成中,对细粒度纹理控制的研究较少(相对于通过“风格传递”方法进行粗纹理控制而言)。

面对的挑战:

(1)对于TextureGAN,网络必须学会将纹理传播到相关的对象边界。要做到这一点,网络必须隐式地分割草图对象并执行纹理合成,这是单独比较困难的任务。

(2)此外,网络还应学会在包裹三维物体形状时缩短纹理,根据环境遮挡和光照方向对纹理进行阴影处理,并理解一些物体部件(手袋扣)不是要纹理,而是要遮挡纹理。

本文创新点

(1) 本文提出一种TextureGAN网络,它是第一种允许用户控制物体纹理的深度图像合成方法。该方法允许用户“拖动”一个或多个任意尺寸的纹理patches到草图对象上,以控制所需的输出纹理。

(2) 引入一个新的判别器loss:local texture loss。

本文算法的核心思想

目前在深度图像合成中,细粒度纹理控制的研究很少。如风格迁移,也是一类图像合成方法,但是其属于粗粒度纹理合成范畴,即该方法追求合成的纹理有效即可(确保合成的结果与原图像上下文一致)。而本文方法属于细粒度纹理合成范畴,即该方法追求合成纹理是否与ground truth相似(检测输入纹理patch和输出图像之间的纹理相似性)。

基于此,作者设计了两个GAN网格,第一个网格用来预训练ground-truth,其目标就是将纹理patch中的信息传播至整个草图。可以理解为生成网络的一个全局处理步骤,用来将输入的草图和纹理合成一个大致与ground-truth相似的图像,该图像的纹理可能存在与草图的边界不对齐,以及纹理不清晰等问题。第二个网络用于对第一个网络合成的图像进行微调,可以理解为一个局部处理步骤,其目标就是使合成的图像更加逼真。图1、图2为相应的网络结构。

以前GAN网络进行颜色控制的一个局限性是,RGB形式的输入颜色约束需要与网络对语义的理解作斗争,例如,手提包多为黑色,而鞋很少为绿色。但是在本文方法中,用户可能拖入违背实际情况的纹理patch,如对鞋的草图贴上绿色patch,这样使用原处理方式可能导致合成不符要求的图像。针对该问题本文方法将图像从RGB颜色空间转换到Lab颜色空间,然后分别对图像的内容和颜色进行处理。

两个网络的输入均为:草图和一些用户提供的纹理patches。其中输入时需要将ground-truth分解为5个通道:

(1)   一个通道的二进制sketch图;

(2)  两个通道的texture (L通道图像和纹理位置的二进制掩码图);

(3)   两个通道的颜色图(a和b通道)。

上述第2条中的二进制掩码图是根据ground-truth图计算得到,数据集提供了相关信息。

Figure 1. TextureGANpipeline for the ground-truth pre-training
Figure2. TextureGANpipeline for the external texture fine-tuning

本文方法的重点在于如何设计网络的损失函数,两个网络的损失函数分别如图3和图4所示。

图3 Ground-truth Pre-training的损失函数 
图4 external texture fine-tuning的损失函数

图4中蓝色线条代表原文中描述的内容,即文中提到在external texture fine-tuning网络中,feature and adversarial losses没有改变,修改了pixel and color losses。但是文中并没有提供color loss,而是提供了Local Adversarial Loss。同时文中提到 adversarial loss没有改变,但是却提供了Local Adversarial Loss。

实验结果

本文所用的数据集为handbags, shoes and clothes。

对于handbags, shoes数据集,本文使用pix2pix方法生成草图。而对于clothes数据集,本文使用原数据集提供的解析数据得到相应的草图。

对于纹理Patches,本文在数据集中随机裁剪得到。另外为了增强算法的鲁棒性,作者还在谷歌上搜索了大量的leather-like纹理,然后手工制作了130幅高分辨率的leather纹理用于网络训练。

在本文方法中,输入的训练草图和纹理都是自动从ground truth的照片中提取出来的,这些照片反过来又作为初始训练的ground truth。

Note:测试时,不使用二进制掩码图。

Figure 5.  Results for shoes and handbags on differenttextures. Odd rows: input sketch and texture patch. Even rows: generatedresults. (trained resolution 128×128) 


Figure6. Applying multiple texture patches on the sketch.(trained resolution 256×256) 


Figure7. Results on human-drawn sketches. 

从上图中可以看出,本文提出的方法能够合成有效纹理图像,同时也证明了本文方法在基于草图和纹理的图像合成中的有效性。

本文方法性能提升的原因

以前纹理合成方法属于粗粒度纹理合成范畴,其目标是确保合成的结果与原图像上下文一致,而本文方法属于细粒度纹理合成范畴,其目标是检测输入纹理patch和输出图像之间的纹理相似性。本文方法之所以能够取得较好的效果,是因为其针对细粒度纹理进行图像合成。它不再是仅仅要求合成图像的上下文一致,而是在上下文一致的基础上,还要保证合成的纹理图像与输入的纹理patch具有一定的相似性。

对于本文方法是如何控制细粒度纹理合成的问题,本文方法是通过Local Pixel Loss来控制的,即判断输入纹理patch和输出图像之间的纹理相似性。对于粗粒度纹理合成,如风格迁移方法,其总损失函数为L-content + L-style,而本文方法的纹理损失为L-style+ L-pixel + L-adversarial。


内容说明:

上述内容仅个人的点滴粗见,如有不当之处,请同行批评指正。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342

推荐阅读更多精彩内容