《Learning multi-Domain Convolutional Neural Networks for Visual Tracking》论文笔记

1,Multi-Domain Network


网络结构

网络比较精简,3卷积(继承自VGG-M)+2全连接(ReLU+dropouts),共五层,最终由k个branch(对应k个domain)

训练SGD(Stochastic Gradient Descent)

网络精简原因:

1,追踪系统只是想要将target和背景区分开,任务总体来说很简单

2,计算量

2, Learning Algorithm


高亮部分就是核心思想


网络的训练没有太多的特点,用mini-batch 到的指定的iteration就ok

在loss function 没有特定的设定,但domain-independent 还没有很好地理解

3,Online Tracking using MDNet

trick 1: long-term and short-term update

trick 2: Hard Minibatch Mining

trick 3: Box Bounding Regression (提高定位准确率)

trick 4: implementation details(一些实现的小技巧:参数初始化、训练数据、网络的学习速率等)




文章核心思想是将追踪变成了一个简单的二义性问题:将target和background区分开来

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容