3 计算机视觉-阅读笔记（10）

3.8 MTCNN

Multi-task Cascaded Convolutional Networks，多任务级联卷积神经网络。

人脸检测。MTCNN采用PRO三个CNN来做检测。（其实做灰度投影怎么样？只能起到辅助作用吧。）

1 模型思想

该模型利用多级联的结构，从粗到细预测人脸以及相应特征坐标位置，能够适用于各种自然条件下复杂的人脸场景检测，可以实现人脸检测和5个特征点的标定（这个landmark需要增加到很多，才能在人脸检测的基础上做很多事情，否则就只是完成人脸检测的任务）。

主要包括三个网络子结构：

P-Net（proposal networks）
R-Net（refine networks）
O-Net（output networks）。

2 模型架构

模型架构包括4部分：

图像金字塔
为了检测到不同size的人脸，在进入P-Net之前，我们应该对图像进行金字塔操作。
- 根据设定的min_face_size尺寸，将img按照一定的尺寸缩小
- 每次将img缩小到前级img面积的一半，形成scales列表
- 直至边长小于min_face_size，得到不同尺寸的输入图像。
P-Net

图1 P-Net网络结构示意图

图2 P-Net网络详细结构

R-Net

图3 R-Net网络结构示意图

图4 R-Net网络详细结构

O-Net

图5 O-Net网络结构示意图

图6 O-Net网络详细结构

3 算法流程

3.1 P-Net

S1: 将不同尺寸的金字塔图像输入到p-net中，最终得到prob1与conv4-2。prob1中包含box位置信息及其置信度，conv4-2中包含box的回归系数信息。

S2: 利用S1中的prob1与conv4-2生成box，设置阈值为0.6（初筛，阈值小），得到一系列点，映射回原img，以此点为左上角，向右向下各扩展12个像素，得到 $12 \times 12$ 的矩形框。

S3: 对一帧图像上检测到的所有 $12 \times 12$ 矩形框进行NMS运算。

S4: 得到的所有box会放置在一个 $number\times 9$ 的数组里，其中number表示box的数量，9代表box的坐标信息、score、坐标回归信息[x1、y1、x2、y2、score、reg_x1、reg_y1、reg_x2、reg_y2]，利用reg*系列（对应坐标的线性回归参数）可对box进行坐标修正，修正过程可表示为：
$new\_x1 = x1 + reg\_x1 * width\_of\_box \\ new\_y1 = y1 + reg\_y1 * height\_of\_box \\ new\_x2 = x2 + reg\_x2 * width\_of\_box \\ new\_y2 = y2 + reg\_y2 * height\_of\_box$

S5: 目标框修正之后，先做rec2square、然后再pad。其中rec2square是将修正后不规则的框调整为正方形，pad的目标是将超出原img范围的部分填充为0，大小比例不变。

上述步骤可以简写为：

12*12的anchor在不同尺寸的图像上按照stride=1滑动
根据face classification结果判定是否为人脸，小于-->Drop，大于留下
利用回归系数信息进行精修
nms
rec2square
pad
生成一系列候选框

3.2 R-Net

将P-Net最后输出的所有box，resize到 $24\times 24$ 后输入R-Net。
经过R-Net后，输出与P-Net类似，prob1：box坐标信息与置信度与conv5-2的回归系数信息。
根据所得的置信度信息与该层阈值对比，小于阈值的直接drop掉，大于阈值的留下，
nms
利用回归系数信息进行精修
rec2square
pad

3.3 O-Net

将R-Net最后输出的所有box，resize到48*48后输入O-Net。经过O-Net后，输出prob1：box坐标信息与置信度、conv6-2的回归系数信息、以及conv6-3的关键点坐标信息。

conv6-3是 $number\times 10$ 的二维数组，number代表box的数量，10则包含了5个关键点信息的x、y坐标信息：[Rx1,Rx2, Rx3, Rx4, Rx5, Ry1, Ry2, Ry3, Ry4, Ry5]，此时的坐标为目标框内部的比例，最后映射回原img得到真实的坐标。

根据prob1置信度信息与该层阈值对比，小于阈值的直接drop掉，大于阈值的留下，再利用回归系数信息进行精修，最后再进行一次NMS。

最后，输出一副包含人脸框与人脸关键点的检测图像。

3.4 损失函数

损失函数包括三个方面：

人脸分类损失
bbox回归损失
人脸landmark定位损失

$Loss = \min \sum_{i=1}^N \sum_{j \in (det, box, landmark)} \alpha_j \beta_i^j L_i^j$

$\alpha_j$ 代表对应任务的重要性
P-Net: $\alpha_{det} = 1, \alpha_{box}=0.5, \alpha_{landmark} = 0.5$
R-Net: $\alpha_{det} = 1, \alpha_{box}=0.5, \alpha_{landmark} = 0.5$
O-Net: $\alpha_{det} = 1, \alpha_{box}=0.5, \alpha_{landmark} = 1$

$\beta \in (0, 1)$ 代表样本类型

边训练边选择出hard sample,只有hard samples才进反向传播，其他样本不进行反向传播。具体做法：对每个小批量里所有样本计算loss,对loss进行降序，前70%的samples 做为hard samples进行反向传播。

最后编辑于：2019.05.03 08:42:22

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 217,277评论 6赞 503
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,689评论 3赞 393
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 163,624评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,356评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,402评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,292评论 1赞 301
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,135评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,992评论 0赞 275
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,429评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,636评论 3赞 334
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,785评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,492评论 5赞 345
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,092评论 3赞 328
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,723评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,858评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,891评论 2赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,713评论 2赞 354