8.5 YOLO V2
YOLO V2相比V1的改进部分有:
- 大尺度预训练分类
- 新网络:Darknet-19
- 加入anchor
图1 YOLO V2和V1的比较
下面分别介绍YOLO V2的重要特征
- Batch Normalization。使用批量归一化,去除dropout,提高模型的泛化能力。通过增加BN层,提高了2点mAP。
- 使用大尺寸图片
来微调VGG或resnet网络,然后使用微调后的网络进行特征提取。
- 带锚框的卷积层。去掉了全连接层,使用卷积层。
- 维度聚类。先对标签做了聚类分析,根据聚类分析的结果,使用聚类分析的先验框来预测。
-
新网络(Darknet-19)。图2 darknet-19
-
直接位置预测。图3 位置预测
- Fine-Grained Features。
- Multi-Scale Training。每隔一定数量的epochs之后,改变输入图像尺寸。32的倍数{320,352,…,608}。
YOLO V2的训练
- 第一阶段:先在ImageNet分类数据集上预训练Darknet-19,此时模型输入为
,共训练160个epochs。
- 第二阶段:将网络的输入调整为
,继续在ImageNet数据集上finetune分类模型,训练10个epochs,此时分类模型的top-1准确度为76.5%,而top-5准确度为93.3%。
- 第三个阶段:修改Darknet-19分类模型为检测模型,并在检测数据集上继续finetune网络。 网络修改包括(网路结构可视化):移除最后一个卷积层、global avgpooling层以及softmax层,并且新增了三个
卷积层,同时增加了一个passt hrough层,最后使用
卷积层输出预测结果。