RCNN可实现目标识别(分类)和定位。
步骤:
- 区域推荐,生成1K~2K个候选区域;
- 对于每一个候选区域,使用深度神经网络提取特征;
- 将特征送入每一类的SVM分类器,判断是否属于该类;
- 使用回归器精细修正候选框位置。
区域推荐
采用selective search的方法,对一张图片提取出若干个候选区域。

区域推荐算法
有现成的库可以实现此功能:
pip install selectivesearch
import selectivesearch.selectivesearch as ss
img, rigions = ss.selective_search(img)
对候选区域提取特征
针对每一个候选区域(尺寸不固定),将其变换为固定尺寸(227*227),然后输入CNN(AlexNet)网络进行训练,提取特征。
分类
将上步骤提取出的特征分别送入SVM分类器和回归器,用于判断特征所属类别和位置。