1.《Selective Search for object recognition》
选择性搜索
图像包含的信息形状、尺寸、颜色、纹理。
物体具有一定的层次性
先将图像分割,对初始的框进行相似性合并。这里,初始的分割还没懂。Efficient Graph-Based Image Segmentation
相似度的计算,1.颜色用的直方图交距离 2.纹理相似用的sift-like特征,最后类似于颜色 3.大小相似的 4.吻合相似度
实验中,特征生成,初始的样本的选择,训练过程中引入错判的样本。Object detection with discriminatively trained part based models
http://blog.csdn.net/niaolianjiulin/article/details/52950797
http://blog.csdn.net/surgewong/article/details/39316931
2.R-CNN
用到了迁移学习的思想?
非极大值抑制
1.候选框 缩放,各向同性没看懂
2.如果不针对特定任务进行fine-tuning,而是把CNN当做特征提取器,卷积层所学到的特征其实就是基础的共享特征提取层,就类似于SIFT算法一样,可以用于提取各种图片的特征,而f6、f7所学习到的特征是用于针对特定任务的特征。打个比方:对于人脸性别识别来说,一个CNN模型前面的卷积层所学习到的特征就类似于学习人脸共性特征,然后全连接层所学习的特征就是针对性别分类的特征了。