2019-06-22
计算机视觉算法岗面经:两万字啊你确定不看看
【计算机视觉算法岗面经】“吐血”整理:2019秋招资料
学习笔记-目标检测、定位、识别(RCNN,Fast-RCNN, Faster-RCNN,Mask-RCNN,YOLO,SSD 系列)看这篇我都不想整理了
RCNN
Fast RCNN
Faster RCNN
Mask RCNN
YOLO v1 v2 v3
SSD v1 v2
MobileNet v1 v2
FCN
1 RCNN (2014)
检测问题转换成分类问题
- 步骤:
step1 Selective Search -> 选择2000个候选框
step2 resize成固定大小后后输入AlexNet -> 得到4096维的特征向量
step3 经过SVM -> 得到分类结果 - Selective Search
step0:生成区域集R,具体参见论文《Efficient Graph-Based Image Segmentation》
step1:计算区域集R里每个相邻区域的相似度S={s1,s2,…}
step2:找出相似度最高的两个区域,将其合并为新集,添加进R
step3:从S中移除所有与step2中有关的子集
step4:计算新集与所有子集的相似度
step5:跳至step2,直至S为空 - 缺点:
Selective search耗时多;每个候选区域都进CNN,耗时多。
2 Fast RCNN (2015)
- 改进:过一次CNN,全局提取一次特征。然后用RoI Pooling,将对应候选框的部分做采样,得到相同长度的特征,又经过两层全连接层之后得到最终的特征。接着产生两个分支,一个分支给此特征分类,另一个分支回归此特征的候选框偏移。Fast-RCNN将分类和回归任务融合在一个模型中。除了Selective search,其他部分可以一起训练。
- 核心:RoI Pooling
3 Faster RCNN (2016)
- 改进:提出Region Proposal Network(RPN)生成待检测网络,取代了原来的Selective Search,真正实现了端到端的训练(end-to-end training)。
- 核心:RPN
4 Mask RCNN (2017)
Instance segmentation
- Mask RCNN = Faster RCNN 目标检测 + FCN 语义分割
具体:Mask RCNN = RPN + ROIAlign(替代RoI Pooling) + Fast-rcnn(应该是RCNN吧) + FCN - 核心:ROIAlign
5 FCN
6 YOLO
7 SSD
https://baijiahao.baidu.com/s?id=1589193367356614998&wfr=spider&for=pc
特点:多尺度
8 MobileNet
特点:深度可分离卷积