深度学习知识点汇总-目标检测(5)

8.5 YOLO V2

YOLO V2相比V1的改进部分有:

  1. 大尺度预训练分类
  2. 新网络:Darknet-19
  3. 加入anchor
图1 YOLO V2和V1的比较

下面分别介绍YOLO V2的重要特征

  • Batch Normalization。使用批量归一化,去除dropout,提高模型的泛化能力。通过增加BN层,提高了2点mAP。
  • 使用大尺寸图片448 \times 448来微调VGG或resnet网络,然后使用微调后的网络进行特征提取。
  • 带锚框的卷积层。去掉了全连接层,使用卷积层。
  • 维度聚类。先对标签做了聚类分析,根据聚类分析的结果,使用聚类分析的先验框来预测。
  • 新网络(Darknet-19)。
    图2 darknet-19
  • 直接位置预测。
    图3 位置预测
  • Fine-Grained Features。
  • Multi-Scale Training。每隔一定数量的epochs之后,改变输入图像尺寸。32的倍数{320,352,…,608}。

YOLO V2的训练

  • 第一阶段:先在ImageNet分类数据集上预训练Darknet-19,此时模型输入为224\times 224,共训练160个epochs。
  • 第二阶段:将网络的输入调整为448\times 448,继续在ImageNet数据集上finetune分类模型,训练10个epochs,此时分类模型的top-1准确度为76.5%,而top-5准确度为93.3%。
  • 第三个阶段:修改Darknet-19分类模型为检测模型,并在检测数据集上继续finetune网络。 网络修改包括(网路结构可视化):移除最后一个卷积层、global avgpooling层以及softmax层,并且新增了三个3\times 3 \times 2014卷积层,同时增加了一个passt hrough层,最后使用1\times 1卷积层输出预测结果。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容