目录:
- 1. 图片预处理
- 2. RPN网络预测
- 3. RPN to ROIs
- 4. Classifier 网络预测
- 5. Classifier网络输出对 ROIs过滤与修正
- 6. NMS (非最大值抑制)
7. 坐标转换为原始图片维度
一: 输入输出
输入:
- boxes_on_resize: 最终提取出来的bbox,是在VGG16 输入图片维度上的坐标
- ratio: 原始图片与VGG16 输入图片的比例关系
输出:
- boxes_on_origin: 原图上的矩形框.
二: 流程
- 坐标除以ratio
三: code by code
ratio是 resize 图片size / 原始图片size
将 VGG16 输入图片维度上的坐标 转换为原始图片维度上.
private INDArray get_real_coordinates(INDArray bboxes_on_resize, float ratio)
{
assert bboxes_on_resize.rank() == 2;
assert bboxes_on_resize.shape()[1] == 4;
return Transforms.round(bboxes_on_resize.castTo(DataType.FLOAT).div(ratio));
}