阅读笔记 - A Simple Baselline for Multi-Object Tracking (FairMOT)

来源于华中科大的一篇anchor-free结构同时detect和ReID的多目标跟踪方法,(和我们的方法撞车了把我们撞的稀碎。。。欲哭无泪)

image.png

摘要

目标检测和ReID近些年了发展较快,也促进了MOT任务的推进,但MOT领域对如何将检测和ReID融合成一个网络的研究相对少的多。检测和ReID放在一个网络中的尝试往往会导致跟踪性能下降,这是因为ReID抽取的特征鉴别力较弱。所以这篇文章主要是研究了导致联合网络性能较差的背后原因,以及对应的解决办法。
文章方法的跟踪速度能到达30FPS, 且跟踪性能不错。
开源代码。github 代码

简介

当前主流的多目标跟踪方法一般将MOT划分成两个子任务:检测和关联。这两子任务近些年都取得长足进步,但分离的操作严重拖累了MOT的推理速度。

一般我们认为MOT分为三部分:检测,特征抽取和数据关联。这里把特征抽取作为了数据关联中的一部分。相当于把ReID认为是一个关联问题。

越来越多的研究开始采用one-shot的单任务学习中将检测和ReID特征抽取一起处理的做法。目标检测和特征抽取其高层任务虽然不同,但底层可以共享基本的特征,通过共享底层结构,能够较显著的降低推理时间。但和two-stage方法相比,其精度一般较差,尤其是IDS较严重,这表明简单的通过共享网络将两个任务融合起来是不可行的。

本文分析认为one-shot方法性能下降的原因有三点:

  • anchors dont fit Re-ID. 现在的one-shot方法一般是基于anchor的,这就会带来一个问题:多个不同的anchor会被用来估计同一个目标,导致网络的歧义性,如图1。另外在检测任务中,一般图像下采样较大,这会给reID带来严重的精度损失。


    image.png

个人认为这个地方论述不够准确,虽然多个anchor会负责同一个目标,但经过检测回归后这些anchor回归的结果还是很相近的,并不会带来歧义性。 虽然我们的方法也采用了anchor-free的思路,但我们的出发点是一个location上对应多个anchor,于是回归可能对应不同目标的多个bbox,但ReID分支一般在该location上仅抽取一个特征向量,于是这个特征向量的标签就会具有歧义性,导致ReID特征鉴别性下降。

  • 多层特征融合。 ReID特征需要同时利用到底层细节特征和高层的语义特征,因此针对于不同尺寸的目标,需要从不同的stage抽取特征,所以为了增强特征鉴别性,需要特征的融合。

  • 特征的维度。ReID方法所使用的数据集一般都是crop和resize之后的,对于跟踪而言无法使用,所以跟踪能使用的数据相对较少,为了避免模型过拟合,可以使用低维的鉴别特征。

文章的共享贡献点:

  1. 陈述了目前one-shot的MOT方法背后存在的问题;
  2. 从其他领域借鉴了一些方法和概念处理这些存在的问题,提供了一个简单却强大的baseline。

方法介绍

本文方法的框架图:


image.png
backbone

基干网络采用的是ResNet-34,然后不同的stage之间采用修改版的Deep Layer Aggregation (DLA)进行融合,最终输出的特征map相对于输入下采用的4倍,而不是原来的32倍,能有效提升检测的精度和特征抽取的精度。

目标检测分支

检测分支采用的是基于center的目标检测,包含三个目标头:热图、中心点位置回归、尺寸回归。
热图用于选择哪些位置对应的正样本,可以用来回归检测框,中心点位置回归和尺寸回归其实和传统的bbox回归作用是一样的。

特征嵌入分支

通过一个卷积层在每个location上输出128维的特征向量,用于特征匹配。

损失函数定义

热图 热图主要是用来确定正负样本。其gt由bbox的中心点位置确定,
M_{xy} = \sum_{i=1}^N \exp{-\frac{(x-c_x^i)^22+(y-c_y^i)^2}{2\sigma_c^2}}
表示heatmap的gt,假设每个检测的可能位置都是以检测中心点为中心的高斯分布,于是M_{xy}就是其非参估计获得的联合分布。
于是采用FocalLoss计算heatmap的回归损失:
L_h = -\frac{1}{N}\sum_{xy} \begin{cases} (1-\hat{M}_{xy})^\alpha \log(\hat{M}_{xy}), \text{if }M_{xy}=1,\\ (1-M_{xy})^\beta (\hat{M}_{xy})^\alpha \log(1-\hat{M}_{xy}), \text{otherwise} \end{cases}
其中(1-M_{xy})^\beta是负样本的重要性加权,显然离中心点越近的点将其作为负样本的置信度越小,于是其在负样本的损失函数中起的作用让其越小。\hat{M}是预测得到的heatmap。

位置偏差和尺寸回归
简单的采用L1损失函数,值得注意的是这里中心点回归的位置是相对于其取整后的小数部分作为offset。

鉴别损失
和传统的ReID损失相同,直接将匹配问题转化成了分类问题,采用交叉熵损失。

在线跟踪

网络推断
由heatmap通过阈值筛选出可能是正样本的位置,在该对应位置中由回归得到的offset和size组装其回归的bbox,然后进行NMS,对于保留的bbox,由其中心点选择回归得到的鉴别特征。

在线bbox关联
标准的MOT流程,采用ReID进行关联,关联失败的采用IOU关联。在关联过程中通过kalman滤波剔除空间不合理的关联。这里提到表观跟踪的策略是在每一帧中通过Correlation filters进行更新。

实验部分

  • 数据和JDE中的数据集相同,用了额外的检测和reid数据。度量方法也和JDE中相同,除了MOT的度量系统CLEAR之外,引入了检测精度指标AP和ReID特征鉴别性度量指标 True Positive Rate(TPR).

  • 实现细节:DLA-34的变种作为backbone,现在COCO检测数据集上进行了预训练。使用Adam优化器训练了30个epoch(比JDE训练次数少),学习率由1e-4在20和27个epoch上分别降低10倍。 batchisize是12. 采用了旋转、尺度缩放,颜色抖动的数据增强。输入尺寸1088*608. 2张2080上训练了差不多30小时,速度还是挺快的。

  • 实验组织:

    • 将anchor-free的检测头换成anchor-based,其他不变,验证anchor-free的有效性。结论anchor-free能显著增强特征鉴别性。

    • 采用不同的下采样步长,发现相同步长下,anchor-free优于anchor-based方法/ 分辨率较高的情形,anchor-based反而性能下降了,作者认为是未对齐的anchors更多导致训练不充分。

    • 对比了不同backbone


      image.png
    • 不同的backbone对于不同尺寸目标的检测跟踪对比


      image.png

      image.png

      实验DLA性能优势主要体现在对于中小物体提取的特征鉴别性更好。

    • 不同的特征维度,维度的影响其实不大


      image.png
    • 最后是对SOTA的对比。
      这部分没有给出FN的对比,FN对于MOTA一般影响最大。

总结:实验设置部分要紧紧围绕着文章提出的创新点来做,依次证明宣称的创新点是有效的。

总结

提出一个简单有效的one-shot多目标跟踪。所以MOT联合框架设计考虑的要素:anchor-free, 大分辨率,不同stage的特征融合。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 225,124评论 6 523
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 96,453评论 3 404
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 172,386评论 0 368
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 61,136评论 1 301
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 70,142评论 6 400
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 53,593评论 1 315
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 41,958评论 3 429
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 40,944评论 0 279
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 47,477评论 1 324
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 39,512评论 3 346
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 41,639评论 1 355
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 37,227评论 5 351
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 42,971评论 3 340
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 33,397评论 0 25
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 34,550评论 1 277
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 50,203评论 3 381
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 46,713评论 2 366