目标检测入门

之前也大概看了一些论文和博客,也做过目标检测的PPT,给人讲过几次,但是一直没有一个比较完整详细的记录下来,故想好好的整理下。

  1. 什么是目标检测
    CV领域有四大任务:

    • 分类:判断图片包含说明类型的目标
    • 定位: 给出目标的位置
    • 检测:给出目标的位置及类别
    • 分割: 判断每一个像素属于哪个目标物或场景
  2. 核心问题

    • 目标可能出现在图片的任何位置
    • 目标的形状多样
    • 目标大小多样

3 评价指标
评价的指标有多个维度,一般常用的map,fps等,这里我们介绍下一些指标。

  • TP, FP,TN, FN ,Recall,Precision


    TP.PNG

P(准确率) = \frac{TP}{TP+FP}   R(召回率) = \frac{TP}{TP+FN}

召回率是对全局的一个把握,即系统检测到的数目除以系统所有的需要检测的数目,准确率是对你给出检测的精度一个定义,是检测正确的数目除以总检测数。

  • P-R曲线
    以召回率为横坐标,精确率为纵坐标,用不同的阈值,统计不同阈值下的召回率和精确率。

    PR.PNG

    AP = \int_0^1 {P(R)} \,{\rm d}(R)
    AP(average precision) - PR曲线下的面积
    mAP = \frac{1} {classes} \sum_{i=1}^{classes}\int_0^1 {P(R)} \,{\rm d}(R)
    mAP多个类别的平均AP值

  • IOU
    IOU-intersection of union ,交并比,定义如下:
    IOU = \frac { Area-of-Overlap } {Area-of-Union}

    IOU.PNG

  • FPS
    fps:frame per second ,每秒处理图像的帧数

  1. 目标检测的历史
    从two-stage到one-stage,从r-cnn到faster r-cnn甚至更多版本的two-stage,one-stage的方法也从yolov1到yolov3,ssd以及衍生的多种ssd的方法,目标检测基本上都是沿着这两条路线,故我们看下其发展,从而开始有序的看论文。


之前做过Yolov3的,也看过faster r-cnn的,跑过,但是没有怎么调试,故想接下来认真总结下这些经典的方法。

参考:
目标检测(一)——目标检测综述
目标检测(二)——评价指标

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。