这篇论文,记录了作者做的各种实验,不是通过各种技巧策略来提高性能,而是通过各种数据集的交叉试验验证对比来发现较好的试验结果,通过试验发现总结真理。
对行人检测最近的方法做了介绍:
首先介绍传统的行人检测方法。
然后介绍深度学习的方法:基于R-CNN的行人检测,基于RPN+PB的。
然后介绍这两年的方法,ALF,CSP,MGAN,其中ALF是基于SSD的anchor-based,MGAN 是基于蒙版的可见区域指导网络,CSP是anchor-less的。
关于行人检测的数据集包括:三类。
第一类是用于视频监控的数据集有:Town Center,USC,DaimlerDB,INRIA,FTH,TUDBrussels,
第二类用于自动驾驶的数据集:KITTI,Caltech,CityPersons,ECP,
第三类是web爬取的数数据集:WiderPerson,WiderPedestrian,CrowdHuman
其中第三类的数据集数量和多样性,密集性都比前两个大,第二类处于中间位置,第一类最小
评价标准:
MR-2,表示log False Positive每张图片的平均损失率,取值范围为[0.01,1],False Positive表示预测为假实际为真。
baseline:
用Cascade R-CNN作baseline,此外还用到HRNet,ResNeXt等
实验部分
作者用来几张表来表达他们做的试验:如下图所示,首先在数据集Caltech上,用不同的方法来训练,test出结果,然后在数据集city person上,最后在数据集ECP上,
然后又做了如下实验,如下图所示,训练和预测在不一样的数据集上进行,观察结果,可以看到性能降低一半多,而在city person上训练在Caltech上预测结果和在Caltech上训练预测差不多原因是city person的多样性密集型大于Caltech数据集。
又做了如下的实验:如下图所示,Table 8 上显示前两行数据差不多,是因为city person和ECP数据集都用相似的相机记录的,ECP比city person数据集多样性和密集型大,所以数据差不多
Table 9 表示在CrowdHuman数据集上训练在Caltech上与预测的效果比在Caltech上训练预测效果更好一倍
Table 10 做的实验是巡视是数据集整合,预测在CP数据集上,效果好一点。