1、真实边界框(ground-truth bounding box)的坐标信息返回值是(左上x,左上y,宽,高)
2、以每个像素为中心生成多个大小和宽高比(aspect ratio)不同的边界框。这些边界框被称为锚框(anchor box)。
假设输入图像高为,宽为。我们分别以图像的每个像素为中心生成不同形状的锚框。设大小为(0,1]且宽高比为>0,那么锚框的宽和高将分别为和。当中心位置给定时,已知宽和高的锚框是确定的。
3、Jaccard系数(Jaccard index)可以衡量两个集合的相似度。我们通常将Jaccard系数称为交并比(Intersection over Union,IoU)。给定集合和,它们的Jaccard系数即二者交集大小除以二者并集大小:
4、当锚框数量较多时,同一个目标上可能会输出较多相似的预测边界框。为了使结果更加简洁,我们可以移除相似的预测边界框。常用的方法叫作非极大值抑制(non-maximum suppression,NMS)。