PCN

1、引言

一般情况下有三种策略来解决旋转变换:

  • 数据增强(data augmentation):对于训练旋转不变性的人脸检测,数据增强是最直接的方式,即对训练数据旋转一定的角度。这种方法的优点是竖直的人脸检测方法可以直接使用,不需要其他的额外操作。然而,具有大范围旋转角度的人脸检测需要使用更大的神经网络,导致时间消耗很大,不实用。

  • 分而治之(divide-and-conquer):训练多个检测器,每个检测器检测小范围的旋转角度。例如,四个检测器,包括上下左右四个方向。然而,多个检测器的时间加起来也很多。

  • 旋转路由器(rotation-router):旋转人脸巨大的变化来自于很大的平面旋转角度。一个很自然的想法就是估计人脸旋转的角度,然后将他们旋转成竖直的情况。路由器网络受限估计人脸的旋转角度,然后将人脸旋转成竖直的。很明显,不准确的角度估计导致错误的人脸检测。然而,准确的人脸旋转角度估计是具有挑战的

为了解决以上难题本文提出了一个实时准确的旋转不变性人脸检测方法,改进的校正网络。如下图所示。


PCN

该网络分成三个部分:

  • PCN-1:将人脸校正为上下方向,即校正为[-90°,90°]范围内;
  • PCN-2:将人脸进一步校正为[-45°,45°]范围内;
  • PCN-3:准确的检测人脸,并预测其旋转角度。

本文的创新点在于:

  • PCN网络将人脸的校正过程分成几个子过程,每个子过程都是一个简单的学习。
  • PCN的前两个阶段是粗糙的校正,例如人脸朝上到朝下的学习,和人脸朝左到朝右的学习。

PCN

PCN-1

对于每个输入窗口x,PCN-1有三个目标:有脸和没脸的分类,边界框的回归,和校正:
[f, t, g] = F_1(x)
f是人脸的置信分数,t是表达边界框的向量,g是方向分数。

第一个目标函数检测是否有脸,是最基本的目标:
L_{cls} = ylogf + (1-y)log(1-f)
其中如果x是脸y=1, 否则y=0

第二个目标函数回归人脸边界框:
L_{reg}(t,t^*) = S(t-t^*)
其中tt^*分别是预测的和实际的边界框,Sl_1损失,边界框回归目标包括三个目标项:
t_w = w^*/w
t_a = (a^*+0.5a^*-a-0.5w)/w^*
t_b = (b^*+0.5b^*-b-0.5w)/w^*
其中a,b,w分别表示框的左上方坐标和框的宽度。

第三个目标函数预测人脸的校正方向:
L_{cal} = ylogg + (1-y)log(1-g)

综上,PCN-1的目标函数为:
minL = L_{cls} + \lambda_{reg}L_{reg} + \lambda_{cal}L_{cal}

第一阶段预测的角度为:
\theta_1 = \begin{cases} 0°,\quad g>=0.5 \\\\ 180°,\quad g<0.5 \end{cases}

PCN-2

PCN-2在第二阶段预测旋转角度:
id = arg \quad max g_i

\theta_2 = \begin{cases} -90°,\quad id = 0 \\\\ 0°,\quad id = 1 \\\\ 90°,\quad id = 2 \end{cases}
[-90°,-45°], [-45°,45°], [45°,90°]分别标记为0,1,2

PCN-3

第二阶段之后,所有的人脸校正为[-45°,45°]范围内。因此,第三阶段会更容易更准确的校正人脸。

经过三个阶段之后,人脸的旋转角度为三个阶段旋转的角度之和:
\theta_{RIP} = \theta_1 + \theta_2 + \theta_3
如下图所示,

RIP旋转角度

PCN结构如下图所示


PCN结构

参考文献

[1] Real-Time Rotation-Invariant Face Detection with Progressive Calibration Networks
[2] github

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 人脸检测是目前所有目标检测子方向中被研究的最充分的问题之一,它在安防监控,人证比对,人机交互,社交和娱乐等方面有很...
    玲小喵阅读 451评论 0 0
  • 做心怀善意的人,结温暖踏实的朋友! 一大早接到陌生电话,迟疑了一下还是接了。一上来就打着问卷调查的名义问隐私问题,...
    射手座的疯子Sarah阅读 722评论 0 1
  • 皮肤分为5大类,分别是油性肌肤、干性肌肤、中性肌肤、混合性肌肤以及敏感肌肤。 我今天先来介绍油性肌肤的一些外...
    乔思麻麻阅读 1,052评论 0 0
  • 主题阅读 美国芝加哥学者莫提默在《如何阅读一本书》中讲到阅读有四个层次:基础阅读、检视阅读、分析阅读...
    莲韵奇珍阅读 155评论 0 0
  • 财富不是永远的朋友 而朋友是你永远的财富 朋友是前世的亲人 亲人是前世的朋友 曾想起在荆州的陈继锋,爱好书法研究周...
    草中藏朱阅读 267评论 1 3