IoU-Net 笔记

IoU-Net 论文:Acquisition of Localization Confidence for Accurate Object Detection

旷视联合北大发的一篇论文,主要指出了目标检测方法中,非极大值抑制(NMS) 存在的问题。NMS 以分类置信度为基准执行,而分类置信度并不能很好地反映边框定位的准确程度,这导致一些更准确的定位在 NMS 过程中被抑制。IoU-Net 通过预测一个定位置信度(以 IoU 为预测目标),将定位置信度作为 NMS 的指标,以提升边框的准确度。此外,提出了一种基于优化的边框 refine 方法,代替边框回归。


分析

NMS

非极大值抑制算法:

0. 对于一张图像的目标检测,其结果为n个边界框,其集合记为B=\{b_i|i=1,2,...,n\};选取 NMS 的评估指标c(依照基于 R-CNN 的方法,评估指标为边界框的分类置信度);预设重合度阈值\phi(重合度实际上是 IoU,为了防止和与 GT 的 IoU 混淆,此处写为重合度);NMS结果集合B_{preserved}预设为空集。

1. 对于Bc最大者b_k而言,将所有与它重合度大于\phi的边界框从B中移出,这些边界框被永久地舍弃。将b_kB中移出,放入结果集合B_{preserved}

2. 重复步骤 1 直到B成为空集。

3. B_{preserved}中的所有边界框为 NMS 的输出。

NMS 几乎是所有目标检测算法不可或缺的一步,它能防止冗余的边界框堆叠在同一个目标上。

存在的问题

1. 用分类置信度做 NMS 的指标缺乏一致性

一般而言,Two-stage 网络结构中,(1)首先由 RPN(或其它类似方法)提出 RoI 建议,这个过程中对 anchor 做一次边框回归,和判断内部有无目标;(2)然后 RoI 中的内容经过 RoI Pooling(或其它类似方法)后,输入一个分类网络做分类和边框回归;(3)对输出结果,以分类置信度为标准,进行 NMS 剔除冗余边界框。作者认为,在这个过程中,缺少一种评估 RoI 的“定位置信度”,它应当和分类置信度地位相似,用于当作 NMS 的标准。

NMS 最初被应用于边界框筛选时,就是用分类置信度作为评估指标的,毕竟这是网络的一个现成输出。但是,根据作者的实验,分类置信度最高的边界框,其 IoU 并不一定是最高的。如下图所示,存在很多反例。

分类置信度最高的结果,其边框的 IoU 并不一定最高

统计所有边界框的分类置信度与 IoU 的关系(左下),能够发现它们并没有很好的相关性,尽管它们仍在一定程度上显示出正相关,但在分类置信度低的区域,仍有很多 IoU 较高的边界框,而在分类置信度较高的区域,也有不少边界框的 IoU 只有大概 60%~70%。而作者提出的定位置信度,则与 IoU 呈较好的线性关系(右下),定位置信度的高低能够更好地反映边界框的真实 IoU 大小。评估这两个分布的皮尔森相关系数,可知后者相关性更高。

(左)IoU 与分类置信度的相关性  (右)IoU 与定位置信度的相关性

2. 多次迭代的边框回归并不能单调提升边框定位结果

作者还观察到,有些方法做了多次的边框回归。以 Faster R-CNN 为例,这个过程中有两次边框回归,它们的意义很大程度上是重合的,第二次边框回归起到了 refine 的作用;另外也有一些方法——比如 Cascade R-CNN,采用了更多次数的边框回归。

基于实验性目的,作者在 FPN 框架下和 Cascade R-CNN 框架下,评估了取不同边框回归迭代次数时,最终输出的边框的 AP 指标。不论是基于 FPN 还是 Cascade R-CNN,在一定迭代次数后,边框的准确度都不增反降。数学上,它们的关系是非单调的。

蓝线:基于回归的边框 refine 方法    红线:作者提出的基于优化的边框 refine 方法


IoU-Net

基于定位置信度的 NMS

所谓定位置信度,其实就是在网络的 R-CNN 部分,额外引入了一个支路,预测边界框和 GT 之间的 IoU。

IoU-Net

然后是 IoU-guided NMS 算法,和原始的 NMS 算法几乎一样,只是评估指标改成网络预测的定位置信度。在保留定位置信度最大的边框的同时,如果该边框的分类置信度不如与它高度重叠的(但定位置信度较低的)边界框高,则将该边框的分类置信度记为更高的那个值。

IoU-guided NMS

基于优化的边框回归

Refine 边界框的问题可以被归纳为一个寻找最优变换参数c^*的问题:

c^{*}=\arg \min _{c} \operatorname{crit}\left(\operatorname{transform}\left(b o x_{\mathrm{det}}, c\right), b o x_{\mathrm{gt}}\right)\\

其中box_{det}是 RPN 预测到的边界框,box_{gt}是 GT 边界框;transform是以c为参数的边界框变换函数;crit是评估两个边界框之间的距离的指标,这里采用 IoU。

R-CNN 中提出的边框回归方法——称之为基于回归的方法——采用一个前馈的神经网络直接预测参数\hat c\hat c,但多次的迭代预测对输入分布的变换不具有鲁棒性,因此会形成前述的不单调的优化曲线。

作者提出的方法——称之为基于优化的方法——将 IoU 预测支路作为优化的目标函数,并提出了 Precise RoI Pooling 方法(后面讲)替代原来的 RoI Pooling 层,优化 RoI Pooling 层的可导性。因为 IoU 预测支路内部是可导的,所以可以简单地通过梯度上升算法寻找最优的\hat c

基于优化的边界框 refine 算法

采样

训练 R-CNN 时的采样策略和 Faster R-CNN 原文中略有不同。当选择 RoI 时,不再选择由 RPN 生成的 RoI Proposal,而是对 GT 应用几个随机的变换,舍去和原始 GT 重合度不足50%者,将剩下的作为 RoI。尽管并没有说明原因,但作者表示,从实验结果来看,这种采样方法优于将 RoI Proposal 用作训练 R-CNN 时的 RoI。个人感觉,训练刚开始 RPN 并没有学到 GT 的分布,输出的 RoI Proposal 和 GT 偏差很大,这使得基于 RoI Proposal 的 R-CNN 训练在这个阶段几乎是没有意义的,而作者的做法在一定程度上避免了这个问题。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,417评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,921评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,850评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,945评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,069评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,188评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,239评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,994评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,409评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,735评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,898评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,578评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,205评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,916评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,156评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,722评论 2 363
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,781评论 2 351

推荐阅读更多精彩内容