阅读笔记 - Sparse R-CNN: End-to-End Object Detection with Learnable Proposals

来源: arXiv 2020
代码: https://github.com/PeizeSun/SparseR-CNN

title

本文章针对的是传统基于深度学习的目标检测方法中,采用dense candidate或者dense points策略导致的dense操作问题,提出使用sparse方法进行替代。

abstract

本文提出一种纯粹的用于目标检测的稀疏方法,称之为Sparse R-CNN. 当前目标检测已存的方法严重依赖于密集的目标候选,比如在HxW的特征图所有格点上预先定义的k个锚框等。但是,在本文方法中, 仅利用学习得到的固定大小N的proposals的稀疏集合用于目标识别和目标分类及定位。通过将HWk预先定义的目标候选降到N个可学习的候选,Sparse R-CNN完全避免了目标候选的设计困难以及分配标签是many-to-one的问题。更重要的是,最终的输出可以直接得到,而不用使用NMS等后处理的手段。Sparse R-CNN证明了在精度,运行时间,训练收敛性上虞密集方法的可比性。

Introduction

基于密集候选的检测方法虽然获得了较好的性能,但依然存在一些限制:

  • 这类方法一般会产生大量的冗余结果,需采用NMS后处理的方式获得好的结果。
  • 标签分配是一种many-to-one的方式,导致网络训练对于分配策略比较敏感。
  • 最终的性能受制于size,长宽比,anchor box的个数,或参考点的密度或者proposal的生成算法。

DETR将目标检测问题重新表述成稀疏集合的预测问题,输入时100个学习的查询目标,最终的预测集合不经过后处理直接输出。虽然该结构简单出色,但其需要计算每一个query与全局context的相关性(有点类似non-local attention).这个过程不仅降低了训练收敛速度还使其难以称之为彻底的sparse目标检测流程。

这篇文章直接输入4维可学习的proposal固定集合和固定feature的集合进行训练,然后将这两个集合送入推理环境进行目标检测。

Sparse RCNN

Sparse RCNN的核心思路是使用小集合的proposal boxes取代来自于RPN的数以万计的候选。 Sparse R-CNN的结构如下图所示,包含backbone、dynamic instance interactive head和两个指定任务的预测层。结构的输入包括整幅图像、可学习的proposal boxes和features集合。

Sparse R-CNN

Learnable proposal box

区间在0-1之间的4d可学习参数集合作为proposal boxes,表示每个box归一化之后的中心点和宽、高。作者实验发现初始化对性能影响不大。

概念上讲,这些学习出的proposals其实是训练集上的目标位置的统计结果,作为推理集合的初始猜测,能够较好的猜测哪些部位最有可能有目标。而RPN的方式则和图像内容相关。作者认为使用RPN为第二阶段产生粗滤的结果有点高射炮打蚊子过于奢侈了,而简单的统计特性就能有较好的结果(我觉得这种想法不靠谱,比如训练集如果是个十字路口,那么有行人的位置统计肯定集中在中心,换做测试集是个环路场景,行人都在周围,训练集的统计还有意义吗??但是RPN无惧)

Learnable proposal feature

作者认为proposal box的维度太小,嵌入的信息过于粗糙,必须使用更高的特征嵌入细节特征,于是提出了proposal feature(也是一种依赖于训练集的统计数据)

Dynamic instance interactive head

给定N个proposal boxes, Sparse R-CNN首先使用ROIAlign抽取每个box的特征,每个特征通过prediction head生成最终的预测。
Dynamic instance interactive head的结构如下图所示:

dynamic instance interactive head

对于每个一proposal来说,box通过ROIAlign获得SxSxC的ROI特征,然后使用对应的proposal feature p_i(C)进行内积操作刻画每个bin的特征的重要性程度,加权之后得到长度为C的向量,然后送入3层感知机中进行回归,一个线性映射层进行分类。

dynamic instance interactive head还可以采用迭代的方式进行处理:以获得的predicted box和特征作为下一阶段的proposal boxes和features。

Our proposal feature is irrelevant to position and we demonstrate that our framework can work well without positional encoding. We provide further comparisons in the experimental section.
这句话我觉得有些瞎扯,虽然没有显示的编码位置信息,但是统计特性就包含了位置信息。。。

Set prediction loss.

集合的预测损失包括匹配损失。匹配损失是指无法确定proposal box与gt的对应关系时使用(iou?)二值匹配获得最相似的计算损失:

image.png

其中\mathcal{L}_{cls}, \mathcal{L}_{L1}, \mathcal{L}_{giou}分别对应分类和回归损失。

Experiments

关于检测的细节就不说了。


image.png

Number of proposals这个对比实验中,proposal个数越多AP性能越高,没有分析原因,那岂不是稀疏proposal还是牺牲了精度??

总结

这篇文章其实是提出了一种从训练集学习box分布位置和特征统计特性的一种方法,将该统计特性应用到推理中,并使用可迭代的dynamic instance interactive head不断地细化前景目标与候选框中特征的相似度,从而最终获得较好的检测结果。
个人感觉即使在常用的COCO这种数据库上效果不错,但实际场景中估计效果一般,因为这些统计特性是基于训练集中目标分布位置决定的,而极限条件下一张图片中任何位置和任何大小的目标概率都应该是相同的。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,444评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,421评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,363评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,460评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,502评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,511评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,280评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,736评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,014评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,190评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,848评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,531评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,159评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,411评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,067评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,078评论 2 352

推荐阅读更多精彩内容