PCN

1、引言

一般情况下有三种策略来解决旋转变换:

  • 数据增强(data augmentation):对于训练旋转不变性的人脸检测,数据增强是最直接的方式,即对训练数据旋转一定的角度。这种方法的优点是竖直的人脸检测方法可以直接使用,不需要其他的额外操作。然而,具有大范围旋转角度的人脸检测需要使用更大的神经网络,导致时间消耗很大,不实用。

  • 分而治之(divide-and-conquer):训练多个检测器,每个检测器检测小范围的旋转角度。例如,四个检测器,包括上下左右四个方向。然而,多个检测器的时间加起来也很多。

  • 旋转路由器(rotation-router):旋转人脸巨大的变化来自于很大的平面旋转角度。一个很自然的想法就是估计人脸旋转的角度,然后将他们旋转成竖直的情况。路由器网络受限估计人脸的旋转角度,然后将人脸旋转成竖直的。很明显,不准确的角度估计导致错误的人脸检测。然而,准确的人脸旋转角度估计是具有挑战的

为了解决以上难题本文提出了一个实时准确的旋转不变性人脸检测方法,改进的校正网络。如下图所示。


PCN

该网络分成三个部分:

  • PCN-1:将人脸校正为上下方向,即校正为[-90°,90°]范围内;
  • PCN-2:将人脸进一步校正为[-45°,45°]范围内;
  • PCN-3:准确的检测人脸,并预测其旋转角度。

本文的创新点在于:

  • PCN网络将人脸的校正过程分成几个子过程,每个子过程都是一个简单的学习。
  • PCN的前两个阶段是粗糙的校正,例如人脸朝上到朝下的学习,和人脸朝左到朝右的学习。

PCN

PCN-1

对于每个输入窗口x,PCN-1有三个目标:有脸和没脸的分类,边界框的回归,和校正:
[f, t, g] = F_1(x)
f是人脸的置信分数,t是表达边界框的向量,g是方向分数。

第一个目标函数检测是否有脸,是最基本的目标:
L_{cls} = ylogf + (1-y)log(1-f)
其中如果x是脸y=1, 否则y=0

第二个目标函数回归人脸边界框:
L_{reg}(t,t^*) = S(t-t^*)
其中tt^*分别是预测的和实际的边界框,Sl_1损失,边界框回归目标包括三个目标项:
t_w = w^*/w
t_a = (a^*+0.5a^*-a-0.5w)/w^*
t_b = (b^*+0.5b^*-b-0.5w)/w^*
其中a,b,w分别表示框的左上方坐标和框的宽度。

第三个目标函数预测人脸的校正方向:
L_{cal} = ylogg + (1-y)log(1-g)

综上,PCN-1的目标函数为:
minL = L_{cls} + \lambda_{reg}L_{reg} + \lambda_{cal}L_{cal}

第一阶段预测的角度为:
\theta_1 = \begin{cases} 0°,\quad g>=0.5 \\\\ 180°,\quad g<0.5 \end{cases}

PCN-2

PCN-2在第二阶段预测旋转角度:
id = arg \quad max g_i

\theta_2 = \begin{cases} -90°,\quad id = 0 \\\\ 0°,\quad id = 1 \\\\ 90°,\quad id = 2 \end{cases}
[-90°,-45°], [-45°,45°], [45°,90°]分别标记为0,1,2

PCN-3

第二阶段之后,所有的人脸校正为[-45°,45°]范围内。因此,第三阶段会更容易更准确的校正人脸。

经过三个阶段之后,人脸的旋转角度为三个阶段旋转的角度之和:
\theta_{RIP} = \theta_1 + \theta_2 + \theta_3
如下图所示,

RIP旋转角度

PCN结构如下图所示


PCN结构

参考文献

[1] Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks
[2] github

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350

推荐阅读更多精彩内容

  • 人脸检测是目前所有目标检测子方向中被研究的最充分的问题之一,它在安防监控,人证比对,人机交互,社交和娱乐等方面有很...
    玲小喵阅读 431评论 0 0
  • 做心怀善意的人,结温暖踏实的朋友! 一大早接到陌生电话,迟疑了一下还是接了。一上来就打着问卷调查的名义问隐私问题,...
    射手座的疯子Sarah阅读 685评论 0 1
  • 皮肤分为5大类,分别是油性肌肤、干性肌肤、中性肌肤、混合性肌肤以及敏感肌肤。 我今天先来介绍油性肌肤的一些外...
    乔思麻麻阅读 1,040评论 0 0
  • 主题阅读 美国芝加哥学者莫提默在《如何阅读一本书》中讲到阅读有四个层次:基础阅读、检视阅读、分析阅读...
    莲韵奇珍阅读 129评论 0 0
  • 财富不是永远的朋友 而朋友是你永远的财富 朋友是前世的亲人 亲人是前世的朋友 曾想起在荆州的陈继锋,爱好书法研究周...
    草中藏朱阅读 258评论 1 3