DenseBox: Unifying Landmark Localization with End to End Object Detection

在Cver上看到一篇推文,总结了多篇类似anchor-free论文:
1.DenseBox: Unifying Landmark Localization with End to End Object Detection
2.You Only Look Once: Unified, Real-Time Object Detection
3.CornerNet: Detecting Objects as Paired Keypoints
4.Bottom-up Object Detection by Grouping Extreme and Center Points
5.Feature Selective Anchor-Free Module for Single-Shot Object Detection
6.FCOS: Fully Convolutional One-Stage Object Detection
7.An Anchor-Free Region Proposal Network for Faster R-CNN based Text Detection Approaches
8.FoveaBox: Beyond Anchor-based Object Detector

DenseBox, 这是一篇百度2016年挂出来的论文,距离现在比较早的文章了,现在又被拿出来重提了,因为其中anchor-free的特点,我把它找出来了。发现这是一篇百度的神作,有很多极其超前的思路。出现了特征融合,多任务训练,多尺度,通过添加任务分支进行关键点检测(直到2017年mask-rcnn才公布通过添加掩码在Faster-rcnn进行上进行分割任务)。

DenseBox结构

  1. DenseBox是针对face检测的一个算法,给定一张图片输出face的区域, 同时检测模型是一个全卷积模型,所以图片大小无影响。网络整体结构是VGG19,网络的Conv3_4和Conv4_4之间发生了一次特征融合,融合的方式是Conv4_4层的双线性插值上采样,因此得到的Feature Map和Conv3_4是相同的。上采样之后网络有两个分支Conv5_2_det 和Conv5_2_loc ,分别用于计算检测损失和Bounding Box的回归损失,分支由 卷积核Dropout组成。
image.png

DenseBox设置

  1. DenseBox没有使用一整张图片,而是对图片进行剪裁,从训练图片中裁剪出包含人脸的patch,这些patch包含的背景区域足够完成模型的训练

  2. 根据Ground Truth从训练数据集中裁剪出大小是人脸的区域的高的4.8倍的正方形作为一个patch,且人脸在这个patch的中心,将这个patch resize到 240 x 240大小, 给网络进行输入。

  3. 网络进行训练时候的标签是60x60x5的热图,60表示热图的尺寸,5表示热图的通道数.

image.png
  1. 上图左边就是原始图片,右边就是标签。算法没有使用右图矩形区域,而是使用半径0.3为Ground Truth的高的0.3倍的圆作为标签值,而圆形的中心就是热图的中心,即有图中的白色圆形部分,后面的四通道个热图表示像圆心到最近的Ground Truth的四个边界的距离点。
  2. 一个patch中可能出现多个人脸,如果某个人脸和中心点处的人脸的高的比例在[0.8,1.25]之间,则认为该样本为正样本。

DenseBox多任务损失

  1. 分类损失

对于分类{0,1},这个模型使用L2损失,并没使用hinge loss or cross-entropy loss,按照作者说法这个简单的L2损失也能工作的很好。

image.png
  1. bounding box回归损失

坐标也是l2损失

image.png
  1. 设置mask
  • 对在黑白边缘的灰度区域进行忽略,f(ign)=1.
  • 使用负样本难挖掘策略,计算整个patch的3600个所有样本点,并根据loss进行排序;取其中的1%,也就是36个作为hard-negative样本;随机采样36个负样本和hard-negative构成72个负样本;随机采样72个正样本。参与训练的样本f(set)=1.
image.png
  1. 联合训练
    使用联合训练方式,因为不对负样本进行bounding box回归回归,所以采用λ(loc) =3进行平衡两种任务的损失。


    image.png

DenseBox添加关键点任务变成Refine Network

网络添加Conv5_2_landmark和Conv6_3_det输出,对于检测N个关键点的任务,Conv5_2_landmark有N个热图,热图中的每个像素点表示改点为对应位置关键点的置信度。对于标签集中的第i个关键点(x,y) ,在第i个feature map在(x,y) 处的值是1,其它位置为0.Conv6_3_det就是关键点的分数热力图。

image.png
  1. 多任务联合训练
  • Landmark使用了灰色区域和Hard Negative Mining方法进行采样,损失函数则是使用了采样样本之间的l2损失函数L(lm).
  • L(det) 是前面的检测任务
  • L(rf)也是使用了相同的l2损失函数,是Landmark的分数判别损失。
    通过超参λ det =1 and λ lm =0.5控制损失平衡。
image.png

参考:
目标检测:Anchor-Free时代
那些酷炫的深度学习网络图怎么画出来的?
CVPR2019-Code
人脸检测之DenseBox

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,458评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,030评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,879评论 0 358
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,278评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,296评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,019评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,633评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,541评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,068评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,181评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,318评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,991评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,670评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,183评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,302评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,655评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,327评论 2 358