一: 前言
项目中涉及大量的货车码表图片,目前需要运营同学人工提取出码表里程值,图片会随着项目的实施,会有大量的图片产生,
为了降本增效,需要我们从深度学习的角度来自动化的提取码表总里程值,该任务会分为三个流水线:
- 分类 (判断是否码表)
- 检测 (检测码表坐标)
- 识别(提取码表里程值)
Faster RCNN 是该流水线第二步,检测的具体实现.
二: 测试效果
输入图片
处理后的图片
输入:
图片size为 [height = 1080, weight = 1440, channels = 3]
输出:
码表矩形框坐标为: [x1 = 480, y1 = 400, x2 = 720, y2 = 464]
码表值概率为: 1.0 表示 100%
三: Faster RCNN 推理 流程
- 1. 图片预处理
- 2. RPN网络预测
- 3. RPN to ROIs
- 4. Classifier 网络预测
- 5. Classifier网络输出对 ROIs过滤与修正
- 6. NMS (非最大值抑制)
- 7. 坐标转换为原始图片维度