用Caltech数据训练Faster-RCNN

前面文章用Caltech数据制作成VOC形式,但在实际训练的时候仍然有挺多问题,所需文件如下。



主要是Annotations的问题,有如下几点需要注意:

  • 1 Annotations中要包含所有图片的信息,即使对应图片中没有行人数据,但仍需要xml文件,即有多少张图片就有多少xml。


  • 2 注意box的边界大小,Xmin,Xmax,Ymin,Ymax都需要注意,不要越界,否则会报错(可以在生成xml代码中就对这几个参数进行限幅),否则assert (boxes[:, 2] >= boxes[:, 0]).all() 会报错。
    数据集整理完毕,接下来便是修改参数:
  • 1.lib/networks/中VGGnet_test.py和VGGnet_train.py中n_classes = 2
  • 2.lib/datasets/pascal_voc.pyself._classes = ('__background__', 'person')
    和tools/demo.py中CLASSES = ('__background__','person')
  • 3.pascal_voc.py中self._image_ext = '.png'的修改。
    搞了快一个星期,终于完工。
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容