Faster-rcnn继承了Fast-rcnn所有优点,并提出利用RPN的方式替换SS获得预选框
他继承了前者的损失函数将分类和边框回归合二为一的定义,最终实现了从端到端的
神经网络的学习。这是两步法最为成熟有效的方式之一。
其基本内容如下:
1)图像首先经过一个经典的深度神经网络 13(conv+relu)+4 pooling最终生成特征图
2)生成的特征图首先通过3*3的矩阵后,而后分别对anchor进行二分类,确定是背景色还是非背景色,而后另一路对anchor进行边框偏移量进行修正,两者结合图像信息最终生成预选框
3)ROI Pooling将结合特征图和RPN的结果,提取预选框的特征图 并推给后面的全连接层
4)利用特征图预选框进行分类,并作边框回归。
难点:RPN
其准确度很高