小目标检测的方法总结

一、图片输入层面

  1. 数据增强策略
  • 增加包含小目标样本的采样率,缓解了训练过程中包含小目标图片较少的这种不均衡;

  • 将小目标在同一张图像中多拷贝几次;增加了匹配到小目标GT的anchor的数量;

image.png
  1. <HRDNet: High-resolution Detection Network for Small Objects>
    多尺度输入分别送入独立的主干网络,然后再FPN层结合,最后输入,计算量太大;
image.png
  1. <An Analysis of Scale Invariance in Object Detection – SNIP>

    作者先做了实验,得到在小尺度图像上训练的分类器,得到几个结论:

  • 在高分辨率图像上训练的分类器,以低分辨率上采样图像作为输入,效果最差(因为训练和推理明显在scale层面存在domain-shift);

  • 在低分辨率图像上训练的分类器,以低分辨率图像作为输入,效果会比CNN-B好很多;

  • 在高分辨率图像上训练的分类器,用低分辨率上采样图像fine-tune,然后低分辨率上采样图像作为输入,效果最好。

    image.png

基于以上结论,采用多尺度训练过程中,要在避免那些极小的和极大的(多尺度后)带来的不好的影响时,考虑保证目标有足够的多样性。所以在进行多尺度训练过程中,将每种输入尺度下,不满足要求的proposal以及anchor忽略。论文中使用了三种尺度如图所示,比一般的多尺度训练的尺度跨度要大。

image.png
  • 训练第二阶段的proposals时,在某个图片输入分辨率下,那些不满足尺寸约束的proposals和GT将被忽略(既不是正样本,也不是负样本),这些ROI将是invalid;

  • 对于invalid GT(GT也会分为valid和invalid),训练RPN过程中anchor和这些invalid GT交并比>0.3的将不参与训练;

  • 推理时在某个特别的分辨率下,检测框的尺寸不满足要求也会被滤除;

    image.png

二、 Neck部分(采用金字塔结构改进方案的)

  1. <Deep Feature Pyramid Reconfiguration for Object Detection>

    image.png

一般意义的FPN网络结构是最右边似的结构,而本文中采用的结构则是

image.png

该方法首先无疑是增加了计算量,优点就是最终输出的每一层的特征不是一个线性的变换(应该想表述的说不是从一层特征直接到另一层特征),而是使用共享的多层特征。最终相比RetinaNet提升一个点左右吧,效果一般。VisDrone2020检测的冠军团队采用了这个结构

  1. <AugFPN: Improving Multi-scale Feature Learning for Object Detection> 双阶段专用结构,忽略。

  2. <Path aggregation network for instance segmentation> PANet

    PANet 作为path aggregation network(用在neck部分,效果能够提升4个点左右):是基于Mask-rcnn的改进,主要三点贡献:

image.png
  • 自底向上的路径增强,FPN只是将语义信息向下传递,没有对定位信息传递;本文则增加一个自底向上的金字塔,将浅层的定位信息再传递上去;
  • 动态特征池化:FPN将每个Proposal根据大小分配到不同的特征层,文中解释大小相近的proposal可能分配到相邻的层;特征的重要程度可能与层级没关系,可以说是强行解释了。我认为这样的好处仅仅是每个proposal聚合了更多层的信息。动态池化也就是同一个proposal根据特征图相应缩放,取到特征后进行融合。(proposal是2-stage的名词,表示前景推荐框。RPN网络得到的ROI需要经过ROI Pooling或者ROI Align提取ROI特征,这一步操作中,其他方法都是单层特征,FPN同样也是基于单层特征。)
  • 全连接层融合:如图所示。


    image.png
  1. <M2Det: A Single-Shot Object Detector based on Multi-Level Feature Pyramid Network>

    image.png

该文章利用多个TUM模块试图更充分构建的特征金字塔的网络结构,靠前的TUM提供浅层特征,中间的TUM提供中间层特征,靠后的TUM提供深层特征,通过这种方式能够多次将深层浅层特征融合,参数量多了。和RetinaNet对比可以看到,512输入,都不采用multi-scale推理,mAP由33提升到37.6,小目标精度也提升了一点;以参数量和计算量堆砌的精度提升,不是好方法。

image.png
  1. <Effective Fusion Factor in FPN for Tiny Object Detection>

    image.png

文章认为不同层的重要程度应该和目标的绝对尺度分布有关系,所以在FPN自上而下融合的时候,加入了一个尺度因子用来平衡金字塔不同层的重要性。个人感觉意义不大,实际提升也不明显。

  1. <MatrixNets: A New Scale and Aspect Ratio Aware Architecture for Object Detection>

    1.  采用centerNet作为base:
    
        *   GT根据长宽比分配到具体的layer,再分配到最近的特征点,用来训练中心点热力图;
    
        *   由具体的中心点来回归左上和右下角点;
    
        *   采用的soft nms;
    
image.png
    2.  采用cornerNet作为base: 略

三、 Head部分的改进方案

在VisDrones上的冠军方案和若干其他方案都采用了这种“双头部”的方案。soft-NMS似乎可以提升几个点。

image.png

四、 小目标目前检测不好,主要原因不是小,应该是小且和背景接近,对比度不高。所以可以借鉴伪装物体检测的思路;

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,142评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,298评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,068评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,081评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,099评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,071评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,990评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,832评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,274评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,488评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,649评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,378评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,979评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,625评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,643评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,545评论 2 352

推荐阅读更多精彩内容