FD-GAN: Pose-guided Feature Distilling GAN for Robust Person Re-identification

 github:https://github.com/yxgeee/FD-GAN  pytorch

abstract:
问题:姿态变化

常用办法:human alignment ;learn human-region-based representation

缺点:需要额外计算姿态信息

本文:提出Feature Distilling(蒸馏) Generative Adversarial Network,学到的特征是identity-related且pose-unrelated。

2 related work:

[18]中提出了PG^2以合成任意姿势的人物图像

3 Feature Distilling Generative Adversarial Network

FD-GAN采用了双胞胎网络,包括一个图片编码器E,一个图片生成器G,一个ID 判别器 D_{id},一个姿态判别器D_{pd}。对于网络的每一个分支,输入是一个行人图片+一个目标姿态landmark map。图片编码器将图片准成特征。identity verification 分类器指导特征的生成。然鹅,只使用identity verification 分类器会使编码器不仅编码了行人ID信息,还编码了行人姿态信息,导致学到的特征对于姿态比较敏感。为了使其对姿态具有鲁棒性,我们增加了一个图片生成器G,它以编码器的特征和目标姿势图为条件。我们的假设是,如果学到的特征是Pose-related和identity-related,就可以用来生成同一个不同姿态的图片。身份判别器D_{id}和姿态判别器D_{pd}集成在一起以规范图像生成过程。它们都是conditional  discriminator,即只判别fake or true,而不是判别到底是哪个人或者哪个姿态。网络促使图像生成器与图像编码器一起用伪造的图像欺骗鉴别器。本文还利用双胞胎结构来最小化两个分支的假图像之间的差异,提出了相同姿势损失 same-pose loss,进一步从输入图像中提取与姿势无关的信息。inference时,只使用图片编码器得到特征,不再使用额外的姿态信息。

3.1 Image encoder and image generator

E和G的结构如Fig3.(a)所示。输入图片,E使用resnet-50作为骨干网络将其编码成2048维的特征向量。将特征向量和目标姿态图送入G,生成此人在目标姿态下的图片。目标姿态图是一个18通道的map,每个通道表示一个姿态点的位置,可将其转为类似高斯的热图。通过一个5-block Convolution-BN-ReLU的子网络将其编码成一个128维的姿态特征向量。视觉特征、目标姿态特征、额外的256维度的噪声向量(从标准高斯分布采样得到)被拼接在一起,输入一系列的5 convolution-BN-dropout-ReLU upsampling blocks,得到生成图片。

3.2 Identity verification classifier

设输入两张图片的特征为x_1,x_2d(x_1,x_2)表示网络输出的置信度,loss为二元交叉熵损失:

其中C是ground truth,C=1表示是同一个人。

3.3 Image generation with identity and pose discriminators

Identity discriminator D_{id}是用来判断是否生成的图片跟输入图片是相同的人。图片生成器想要欺骗身份判别器来确保视觉特征包含足够的identity-related 信息。身份判别器跟身份分类器的结构是相似的Fig3.(c)。但是它的resnet-50网络跟E中的resnet-50网络不共享参数,因为D_{id}的目的是区分real/fake,而E的目的是学到姿态无关的特征。它俩之间具有domain gap。设输入图片为x_k,生成图片为y_ky_k表示与输入图像具有相同身份的另一姿态的真实图像,D_i的对抗损失为:

其中\mathcal Y,\mathcal Z分别表示真实的数据分布和生成数据分布。

Pose discriminator 


D_{pd}区分生成图片y_k是否跟目标姿态p匹配,如Fig3.(d)所示。它使用了PatchGAN的结构。输入图片和姿态图首先在通道维度拼接在一起,然后经过4 convolution-ReLU blocks 和 一个 sigmoid函数来得到一个0到1之间的姿态匹配map。此map中的每个位置表示输入图片和每个Landmark的匹配度。图片生成器G尝试欺骗姿态判别器D_{pd}D_{pd}的对抗损失为:

然鹅我们观察到,姿态判别器可能会过拟合姿态信息,即它会记住特定姿态以及行人外观之间的相关性,因为每个图片的姿态通常是独特的。比如,if we use a blue-top person’s pose as the target pose, the generated image of a red-top person might end up having blue top.为了解决这个问题,我们提出了一种pose map augmentation scheme。训练时,对每个landmark,它的一通道Gaussian-like heat-map是在某个特定范围内的随机高斯带宽获得的。通过这种方式,我们可以为相同的姿势创建许多姿势贴图,并缓解姿势过度拟合问题。

Reconstruction loss.

G不仅是用来迷惑判别器的,也是为了生成图片。然而只使用判别器无法确保生成human-perceivable(可感知的) images。因此使用一个重构误差来最小化生成的图片y_k与真实图片的L1之差,





[18] Ma, L., Jia, X., Sun, Q., Schiele, B., Tuytelaars, T., Van Gool, L.: Pose guided person image generation. In: NIPS. (2017) 405–415

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,233评论 6 495
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,357评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,831评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,313评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,417评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,470评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,482评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,265评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,708评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,997评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,176评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,827评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,503评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,150评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,391评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,034评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,063评论 2 352

推荐阅读更多精彩内容

  • 本篇文章十分的长,大概有2万7千字左右。 一、发展史 1、人脸识别的理解: 人脸识别(Face Recogniti...
    放飞人夜阅读 19,942评论 8 122
  • (转)生成对抗网络(GANs)最新家谱:为你揭秘GANs的前世今生 生成对抗网络(GAN)一...
    Eric_py阅读 4,290评论 0 4
  • 思斯的创意,觅秀西园的小伙伴们有一半的家庭去摘草莓! 晨阳掌舵,路上跟我们用一篮鸡蛋作比,讲价格与价值,经济与金融...
    emeraldcy阅读 713评论 2 4
  • 第十六章 [原文] 致虚极,守静笃;万物并作,吾以观复。 夫物芸芸,各复归其根。归根曰静,静曰复命。复命曰常,知常...
    海上明月共阅读 108评论 0 0