13.YOLO系列算法详解1:YOLOV2

这部分基本是在YOLOV1的基础上的一些改进,并且还提出了YOLO9000(9000类检测,恐怖)。
文章主要是三个部分,名字也起的很简洁:
BetterFaster,Stronger

1. Better。

作为YOLO来说,有两个缺点:

  1. 定位不够准确。
  2. 和基于region proposal类的方法相比召回率更低。

1.1 Batch Normalization.

简单来讲就是在每个卷积层的后面(也就是每个卷积层的输入)都加了BN层,这样会收敛快一点,加入BN之后把dropout去掉,实验证明可以提高2%的mAP.
(作者也就只讲了这一段,所以就这样了)

1.2 High Resolution Classifier.

这个主要是介绍了一下检测模型的一般训练策略。一般都不会从随机初始化所有的参数来开始的,一般都是用预训练好的网络来fine-tuning自己的网络,预训练的网络一般是在ImageNet上训练好的分类网络。
在fine-tuning的时候:

  • YOLOV1预训练的时候使用224*224的输入,检测的时候采用的是448*448的输入,这会导致分类切换到检测的时候,模型需要适应图像分辨率的改变。
  • YOLOV2中将预训练分成两步:①:先用224*224的输入来训练大概160个epoch,然后再把输入调整到448*448再训练10个epoch,然后再与训练好的模型上进行fine-tuning,检测的时候用448*448就可以顺利过渡了。

这个方法竟然提高了4\%的mAP.

1.3 Convolutional With Anchor Boxes

这段作者简单借鉴了Faster Rcnn的做法,引入anchor.
YOLOV2主要做了下面的改变:

  1. 删除了全连接层和最后一个pooling层,使得最后的卷积层可以有更高的分辨率。
  2. 缩减网络,用416*416的输入代替448*448,这样做是希望得到的特征图都是奇数大小的宽和高,奇数大小的宽和高会使得每个特征图在划分cell的时候只有一个中心cell,因为大的目标一般会占据图像的中心,所以希望用一个中心cell去预测,而不是四个中心cell。

YOLOv1中将输入图像分成77的网格,每个网格预测2个bounding box,一共只有772=98个box。
YOLOv2中引入anchor boxes,输出feature map大小为13
13,每个cell有5个anchor box预测得到5个bounding box,一共有13135=845个box。增加box数量是为了提高目标的定位准确率。
作者:零尾
来源:CSDN
原文:https://blog.csdn.net/lwplwf/article/details/82895409

按照作者的说法,这个改进的的效果是非常small的,YOLOV1只需要预测98个box,而加入anchor的话快要上千,召回率从0.81上升到0.88,mAP从69.5下降到69.2

1.4:Dimension Clusters

作者说他们在试图吧anchor box用在YOLO的时候遇到了两个issues。

  1. Faster R-CNN中的anchor box的大小和比例是按照经验来设定的(hand picked),然后在训练的时候调整anchor box的尺寸,

作者想的是可不可以通过一定的方式事先确定这样的候选框呢,最终作者采用了K-means方法,但是如果用标准的K-means(欧式距离)的话会导致大的box会比小的box获得更大的误差,更准确的方式是使用IOU来算,所以作者定义了IOU距离,按照IOU越高距离越小的需求,很容易写出这样的公式:
d(box,centroid)=1-IOU(box,centroid)

上图是在VOC和COCO上的聚类结果,综合来说,随着K的增加,平均的IOU是增加的,但是为了综合考虑模型的复杂度和召回率。最终选择K=5

作者还发现:The cluster centroids are significantly different than hand-picked anchor boxes. There are fewer short, wide boxes and more tall, thin boxes.这个是个无关紧要的结论了。

最终实验对比发现:

  1. 采用聚类的5中box就能达到Fast-RCNN 9中box的效果。
  2. 采用聚类分析得到的先验框比手动设置的平均的IOU值更高,模型更容易训练和学习。

1.5 直接位置预测(Direct Location Prediction)







上面这里我是把毕业论文弄过来了,写的其实也不算是特别详细,但是条理性还可以,直接复制牵扯到公式和引用什么的很麻烦,所以直接截图了


未完待续

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,544评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,430评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,764评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,193评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,216评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,182评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,063评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,917评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,329评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,543评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,722评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,425评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,019评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,671评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,825评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,729评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,614评论 2 353

推荐阅读更多精彩内容