FD-GAN: Pose-guided Feature Distilling GAN forRobust Person Re-identification(NIPS 2018)

FD-GAN: Pose-guided Feature Distilling GAN forRobust Person Re-identification(NIPS 2018)

设计了特征提取生成对抗网络(FD-GAN)用于学习与身份相关姿势无关的表示,即在设计网络使得在行人重识别的时候不去考虑姿势。

Introduction

行人重识别(reID)目的是在多个摄像机上匹配具有相同身份的行人图像。姿势变化,模糊和遮挡是行人重识别的一个重大挑战。有使用GAN进行行人重识别算法的研究。zheng 等人提出半监督结构,利用标记平滑正则化生成图像,用于异常值正则化。PTGAN被提出用于弥补不同数据集之间的域差距。GAN还能用于表示学习。

提出的FD-GAN(特征提炼生成对抗网络)尝试在姿势发生变化的同时保持身份信息的一致性。

图1

特征学习过程中应用连体结构,每个分支都包含一个编码器和图像生成器,图像编码器嵌入了输入图像中的人的特征。图像生成器通过编码生成以姿势信息和输入人物特征为条件的新的图像。框架中继承了多个鉴别器,用于区分两个分支生成的图像之间的分支间和分支内的关系。

所提出的身份鉴别器,姿势鉴别器和验证分类器以及重建损失和新颖的相同姿势损失共同规范了用于实现健壮的人reID的特征学习过程。

总的贡献:

  1. 提出新的FD-GAN,用于姿势发生变化的行人重识别。在推理期间不在需要额外的辅助姿势信息或增加计算复杂度。
  2. 人图像生成作为辅助任务,但是仍然生成了质量比较好的图像。

Feature Distilling Generative Adversarial Network

特征提取生成性对抗网络(FDGAN)旨在学习和身份相关,姿势无关的任务表示。

方法总体框架如下所示:

![
图2

所提出的FD-GAN采用了暹罗结构(连体结构),包括图像编码器E,图像生成器G,身份验证分类器V和两个鉴别器(身份鉴别器和姿势鉴别器)。网络的每个分支将人的图像和生成图像的姿势标记图作为输入。图像编码器首先将每个分支的输入的任务图像转换为特征表示,身份验证分类器用于监督行人reID的特征学习。图像生成器G通过给定输出图像姿势和输入图像生成使得学习特征鲁棒并且和姿势无关的图像。身份鉴别器D_{id}和姿势鉴别器D_{pd}用于规范图像生成过程,促进生成器生成图像。这两个判别器都是条件判别器,用于根据输入标识符姿势对输入图像是真是假进行分类。同时鼓励图像生成器和图像编码器共同用伪造的图像欺骗鉴别器。还增加了同一个人的不同图像生成姿势应当一致的损失(图中的Same-pose loss)。整个框架是端到端的方式进行训练。在推断阶段,仅使用了图像编码器没有使用辅助姿势信息。

图3

以上所提到的结构如上图所示。

Image encoder and image generator

图像编码器和图像生成器的结构如上图中a所示,给定一个输入图像,图像编码器利用ResNet-50将其输入图像编码为2048维的特征向量。图像生成器将编码的人物特征和目标姿势图作为输入,旨在生成目标姿势指定的同一人的另一幅图像。然后将视觉特征,目标姿势特征和标准高斯分布采样的附加的256维噪声矢量连接并输入到一系列采样快中输出生成的人图像。

Identity verification classifier

给定来自图像编码器的两个输入图像,身份验证分类器V确定两个图像是不是同一个人。结构如上图中b所示。分类器使用二进制交叉熵损失训练。d \ left(x _{1},x_ {2} \ right)表示sigmoid函数输出的可信度分数。该部分损失函数为:

\mathcal { L } _{ v } = - C \log d \left( x_ { 1 } , x _{ 2 } \right) - ( 1 - C ) \left( 1 - \log d \left( x_ { 1 } , x _ { 2 } \right) \right)

其中的C是置信度标签。

Image generation with identity and pose discriminators

使用生成对抗网络规范图像编码器E,使他只学习身份相关的信息。

Identity discriminator D_{id}

区分生成的图像和同一分支输入人的图像是不是属于同一个人。身份鉴别器网络和上面的身份验证分类网络是相同的。但是不和图像编码器E共享权重。

\mathcal { L } _{ i d } = \max_ { D _{ i d } } \sum_ { k = 1 } ^ { 2 } \left( \mathbb { E }_ { y _{ k } ^ { \prime } \in \mathcal { Y } } \left[ \log D_ { i d } \left( x_{ k } , y_{ k } ^ { \prime } \right) \right] + \mathbb { E }_ { y _{ k } \in \mathcal { Z } } \left[ \log \left( 1 - D_ { i d } \left( x _{ k } , y_ { k } \right) \right) \right] \right)

Pose discriminator D_{pd}

D_{pd}区分生成图片y_k和目标姿态是否匹配。如图中d所示,使用了PatchGAN的结构。对抗损失如下:

\mathcal { L } _{ p d } = \max_ { D _{ p d } } \sum_ { k = 1 } ^ { 2 } \left( \mathbb { E } _{ y_ { k } ^ { \prime } \in \mathcal { Y } } \left[ \log D _{ p d } \left( \left[ p , y_ { k } ^ { \prime } \right] \right) \right] + \mathbb { E } _{ y_ { k } \in \mathcal { Z } } \left[ \log \left( 1 - D _{ p d } \left( \left[ p , y_ { k } \right] \right) \right) \right] \right)

实验中观察到,姿态判别器会出现过拟合姿态信息,它会记住特定姿态和行人外观之间的相似性,因此提出了在线姿势图增强方案,在训练期间,对于每个姿势界标,其在一些特定范围内的随机高斯带宽获得其1通道高斯类热图。

Reconstruction loss

单独的鉴别器不能保证产生人类能看懂的图像,因此引入重建损失,最小化生成图像和对应的真实图像之间的差距。

\mathcal { L } _ { r } = \sum _ { k = 1 } ^ { 2 } \frac { 1 } { m n } \left\| y _ { k } - y _ { k } ^ { \prime } \right\| _ { 1 }

其中mn是图像的像素值。当没有对应的真实图像的时候,不适用这个损失。

Same-pose loss

输入同一个人的两张不同的图像应该会得到近似相同的外观。因此引入这个相同的姿势损失最小化同一个人的两个生成图像和目标姿势之间的差异。这也鼓励了两个输入图像中的学习视觉特征仅仅和身份相关,忽略其他因素。

\mathcal { L } _ { s p } = \frac { 1 } { m n } \left\| y _ { 1 } - y _ { 2 } \right\| _ { 1 }

Over all training objective

\mathcal { L } = \mathcal { L } _ { v } + \lambda _ { i d } \mathcal { L } _ { i d } + \lambda _ { p d } \mathcal { L } _ { p d } + \lambda _ { r } \mathcal { L } _ { r } + \lambda _ { s p } \mathcal { L } _ { s p }

Trianing scheme

共分为三个阶段。第一阶段预训练编码器E和身份验证分类器V。预训练的权重用于初始化第二阶段中的E,V和身份鉴别器D_{id}。第二阶段固定E和V,训练G,D_{id},D_{pd}。第三阶段将整个网络以端到端的方式微调。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,233评论 6 495
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,357评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,831评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,313评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,417评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,470评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,482评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,265评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,708评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,997评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,176评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,827评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,503评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,150评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,391评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,034评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,063评论 2 352

推荐阅读更多精彩内容