19.1 交并比
- 如果该目标的真实边界框已知,这里的“较好”该如何量化呢?
- 一种直观的方法是衡量锚框和真实边界框之间的相似度。
- Jaccard系数(Jaccard index)可以衡量两个集合的相似度。
-
给定集合A和B,它们的Jaccard系数即二者交集大小除以二者并集大小:
- 实际上,可以把边界框内的像素区域看成是像素的集合。
- 如此一来,可以用两个边界框的像素集合的Jaccard系数衡量这两个边界框的相似度。
- 当衡量两个边界框的相似度时,通常将Jaccard系数称为交并比(Intersection over Union,IoU),即两个边界框相交面积与相并面积之比,如图所示。
-
交并比的取值范围在0和1之间:0表示两个边界框无重合像素,1表示两个边界框相等。
- 交并比是两个边界框相交面积与相并面积之比
-
19.2 标注训练集的锚框
- 在训练集中,将每个锚框视为一个训练样本
- 为了训练目标检测模型,需要为每个锚框标注两类标签:
- 一是锚框所含目标的类别,简称类别
- 二是真实边界框相对锚框的偏移量,简称偏移量(offset)
- 在目标检测时,首先生成多个锚框,然后为每个锚框预测类别以及偏移量,接着根据预测的偏移量调整锚框位置从而得到预测边界框,最后筛选需要输出的预测边界框
- 在目标检测的训练集中,每个图像已标注了真实边界框的位置以及所含目标的类别
-
在生成锚框之后,主要依据与锚框相似的真实边界框的位置和类别信息为锚框标注
- 标注锚框的类别和偏移量
-
设锚框A及其被分配的真实边界框B的中心坐标分别为
-
A和B的宽分别为
-
高分别为
-
一个常用的技巧是将A的偏移量标注为:
-
其中常数的默认值为
如果一个锚框没有被分配真实边界框,只需将该锚框的类别设为背景。
类别为背景的锚框通常被称为负类锚框,其余则被称为正类锚框。
-
19.3 输出预测边界框
-
移除相似的预测边界框:非极大值抑制(non-maximum suppression,NMS)。
- 非极大值抑制的工作原理:
- 对于一个预测边界框B,模型会计算各个类别的预测概率。
- 设其中最大的预测概率为p,该概率所对应的类别即B的预测类别。
- 将p称为预测边界框B的置信度
- 在同一图像上,将预测类别非背景的预测边界框按置信度从高到低排序,得到列表L。
- 从L中选取置信度最高的预测边界框B1作为基准,将所有与B1的交并比大于某阈值的非基准预测边界框从L中移除。这里的阈值是预先设定的超参数。
- 此时,L保留了置信度最高的预测边界框并移除了与其相似的其他预测边界框。
- 接下来,从L中选取置信度第二高的预测边界框B2作为基准,将所有与B2的交并比大于某阈值的非基准预测边界框从L中移除。
- 重复这一过程,直到L中所有的预测边界框都曾作为基准。
- 此时L中任意一对预测边界框的交并比都小于阈值。
-
最终,输出列表L中的所有预测边界框。
大数据视频推荐:
腾讯课堂
CSDN
大数据语音推荐:
企业级大数据技术应用
大数据机器学习案例之推荐系统
自然语言处理
大数据基础
人工智能:深度学习入门到精通












