这里有一个不错的分析:https://zhuanlan.zhihu.com/p/37916140
总的来说这篇文章就是结合了单阶段的SSD和两阶段的faster RCNN的优势,在速度和准确率上取了一个这种,网络结构的设计没有什么出奇的地方,只是看完之后有这样一个想法:
单阶段和两阶段最大的区别有两个:
- 单阶段产生的框的大小是固定的,回归就靠一步到位。但是两阶段产生的框已经相对比较稳定
- 单阶段有很多负样本,但是两阶段负样本已经相当少了
本文对于第一个问题的处理已经相对比较成熟了,ODM拿到的框不再是固定的框,这也许是它能有效果提高的一个非常重要的因素。原本的SSD的框的scale给的太固定了,灵活性不够。
但是对于第二个问题解决的似乎还不够彻底,虽然删除了一部分一定是负样本的框,但是在ODM阶段依然有非常多的负样本。