菜鸟实习日记~day20(ILSVRC2016之MCMOT)

MCMOT: Multi-Class Multi-Object Tracking using Changing Point Detection

这篇文章比较出彩的地方就是  多目标跟踪+context region

一、成绩

•Object Detection from Video (VID)                2ndplace(mAP: 73.15%)

•Object Detection/Tracking from Video (VID) 2ndplace(mAP: 49.09%)

二、主要结构

Faster R-CNN Object Detector 加上 MCMOT(Multi-Class Multi-Object Tracking)

(1)Faster R-CNN Object Detector

由于视频中有些帧中的object 比较小,所以文章采取了large feature map(即去掉VGG-16中的pool4)

同时,视频帧也存在模糊的情况,本文应用了context region

我们知道一幅图不同proposal对应图像不同的region,这样的话每个region对与最终分类的贡献也就不一样,可以分为三类:

target region:本身包含了分类目标(比如人);

context region:上下文,比如出现了一匹马通常就会有人(一般是人骑马);

背景区域:比如一棵树和人同时出现在图像中,而树和人在日常生活中并没有太相关的联系,所以可以把树看成背景区域,包含噪声。

这三种很明显的target region对分类的贡献高于其他两者,context region高于background noise region。

cross region pooling:跨区域合并

(2)数据集的选取和扩充

由于视频图片的冗余性和单一性,需要大量的训练数据,于是文章利用COCO数据集进行pre_train.

(3)MCMOT: Multi-Class Multi-Object Tracking using Changing Point Detection

这里没有看的非常明白,但大概意思应该是提出基于变换点检测的多目标跟踪算法[11],该算法首先检测出目标,然后对其进行跟踪,并在跟踪过程中对跟踪轨迹点进行分析处理,可以较好地缓解跟踪时的漂移现象,并能在轨迹异常时及时终止跟踪。

贴一张原理流程图

还解释了是否需要复杂的跟踪算法:Based on high performance detection,simple & fastMOT algorithm can achieve competitive result,是不需要的,因为detection部分已经有很好的表现了

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 文章作者:Tyan博客:noahsnail.com | CSDN | 简书 声明:作者翻译论文仅为学习,如有侵权请...
    SnailTyan阅读 23,561评论 1 35
  • 每次回老家,一进房间就会拎起“铃木先森”出来晃一晃,就是最常见的那种玩具熊。而且他还是阿姨家里买床上四件套的时候送...
    柳晚阅读 2,405评论 0 1
  • 疁城散人 何谓神,神既是你自己的心。何谓自然,自然既是世间万物。术既是如何面对自然的方法。道法自然,既用心体会世间...
    飘雪之梦阅读 4,746评论 0 1
  • 她对他说:“我们还是保持安全距离吧,我不想和你成为进一步的朋友。” 他就去查了一下地图,然后说:“我们之间相距13...
    投稿圈阅读 3,610评论 0 1
  • 二、 第二天早上醒来早已日上杆头了。头疼隐隐约约传来,床头的窗子昨晚一直开着,对着院子的一个角落。苍白的墙体下几株...
    水果心动阅读 1,670评论 0 0