在斗鱼上参加了浙江大学硕士生王蒙蒙女神的单目标跟踪的分享直播,很受用。
Overview about visual tracking
1、在单目标跟踪中,什么是可视化跟踪呢?
What is visual trackiing?
Object Given:
The traker is initialized with a bounding box in the first frame
Model-Free:
Without usingany explicit appearance or shape model
Single Object:
Mainly focus on single object tracking
Real-time:
It is better to track an object in real-time for practical application
2、可视化跟踪主要用在哪些方面?
Service robot
Intelligent monitoring
Intelligent Transportation
Human-computer interaction
3、visual tracking中经常会遇到哪些问题?
在进行目标跟踪的过程中,不可避免的会遇到以下4类问题,这些问题在阅读相关tracking的论文也经常被提出来。要知道这些问题是什么,才能针对这些问题提出相应算法做改进,改善跟踪的效果。要知道提出的每个跟踪算法就问题而言改善了哪个,这样的学习会更加的清楚。
诸多的挑战:Motion Blur、Occlusion、Deformation、Scale Variation.
缺乏training samples
Typical Trackers
1.CF based trackers
KCF:High-Speed Tracking with Kernelized Correlation Filters
LMCF:Large Margin Object Tracking with Circulant Feature Maps
2.CNN bases trackers
SiamFC:Fully-Convolutional Siamese Networks for Object Tracking
ECO:Efficient Convolution Operators for Tracking
Summary&Tips
在做目标跟踪时,有以下3个方面可以考虑,针对这些方面做选择,可以构成各式各样的跟踪器。上图
My Thoughts
在阅读Paper时,要知道文章的技术点在哪里,用到了什么技巧或者技术。
提出的算法性能很好,State-of-the-art,要知道为什么性能好,做个总结,例如在Large Margin Object Tracking with Circulant Feature Maps这篇文章中,LMCF因为作者主要是关注实时性做的,速度很好,好的原因做以下总结:
Conclusion & Contributions
Powerful classifier
Multimodel target tracking
High-confidence model update:在模型更新这块儿,鲁棒性很好
而这些恰巧就是文章的技术点或者创新点,我们要做的工作就是提出创新点,这个创新可以是针对某一问题训练一个网络。
再例如,对于ECO:Efficient Convolution Operators for Tracking可以做如下总结。
Conclusion:
CNN+HOG+CN
Powerful filters
Training components(diversity)
Update the filters every 6 frames
在这里,我们要明确的一点是:低层特征有较高的分辨率,能够对目标进行精确定位。高层特征包含更多的语义信息,能够处理较大的目标变化和防止跟踪器漂移,能够对目标进行一定范围的定位。当然,越低层的特征,跟踪器的速度越快,但精度不见得那么好,这是可想而知的。在做跟踪时具体选什么特征还要好好想想。
做模型更新时,如果每帧都更新的话,那会使得跟踪速度变慢,因为模型的Update是很耗时的。在这里,可以想想更新的策略,如ECO提出的每6帧更新一次,LMCF提出的关于阈值的High-confidence model update。不过,个人感觉,High-confidence model update会更好些。