用Caltech数据训练Faster-RCNN

前面文章用Caltech数据制作成VOC形式，但在实际训练的时候仍然有挺多问题，所需文件如下。

主要是Annotations的问题，有如下几点需要注意：

1 Annotations中要包含所有图片的信息，即使对应图片中没有行人数据，但仍需要xml文件，即有多少张图片就有多少xml。
2 注意box的边界大小，Xmin,Xmax,Ymin,Ymax都需要注意，不要越界，否则会报错（可以在生成xml代码中就对这几个参数进行限幅），否则assert (boxes[:, 2] >= boxes[:, 0]).all() 会报错。
数据集整理完毕，接下来便是修改参数：
1.lib/networks/中VGGnet_test.py和VGGnet_train.py中n_classes = 2
2.lib/datasets/pascal_voc.pyself._classes = ('__background__', 'person')
和tools/demo.py中CLASSES = ('__background__','person')
3.pascal_voc.py中self._image_ext = '.png'的修改。
搞了快一个星期，终于完工。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

赞1赞

赞赏

手机看全文