自从深度学习火了之后,这片火就迅速燎向图像处理的其他领域,最近一直在研究目标检测到内容,有些小收获,简书记录之。
深度学习应用于目标检测之前到传统方法是:使用sift算子对图片提取特征,并将特征送入分类器进行训练,实现目标检测。
而后Ross将深度学习应用于目标检测,开启了深度学习的目标检测,之后大约分为四个阶段,我将一一介绍之。
第一阶段:RCNN,这是深度学习之目标检测的开篇之作,整体流程:
1.使用ILSVRC2012数据集对CNN进行预训练,再通过PASCL VOC数据集对CNN进行微调训练,训练好到CNN放起来留作下一步提取特征;
2.采用selective search算法将PASCL VOC的训练集中每一张图片都生成大约2000个建议窗口(小图片),将这每一张小图片送入CNN提取特征值并用这些特征值训练SVM;
3.采用selective search算法将PASCL VOC的测试集中每一张图片都生成大约2000个建议窗口(小图片),将这每一张小图片送入CNN提取特征值并将这些特征值送入训练好的SVM进行分类。