Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
由于之前的RCNN或是SPPnet或是FasterRCNN都是利用select search来做Region proposal的,即使把这种算法移植到GPU上,这种算法也忽略了很多sharing computation的机会.所以这篇文章提出了Region Proposal Network(RPN),只利用深度学习网络来训练得到Region Proposal.
RPN 的输入是一张照片,输出是一个长方形的区域,以及这个区域是否为物体的得分.
具体计算原理是先对VGG等常规网络最后的卷积层后加入3*3的小卷积,作为一个滑动窗口,然后分别再做两次1*1的卷积,得到anchor box分别是否为物体,以及他对应的候选区域的长方形.对于每一个feature map,我们这里可以得到9个anchor.
最后在经过一个loss function做整体优化.
具体细节,参考:
https://blog.csdn.net/hunterlew/article/details/71075925