一、准备自己的数据
拿nwpu数据集来举例,nwpu数据集文件夹中的内容是:
images文件夹:存放数据图片
labelTxt文件夹:存放标注信息,images文件夹中每张图片都对应一个txt文件存放在此文件夹中,图片与标注文件的名称相同
test.txt和train.txt:记录训练集和测试集中的图片名称
二、转换成voc格式数据集
转换过程提供了两个脚本以简化操作,将create_dir.py
与creat_annotations.py
拷贝至希望存放voc数据集的目录(VOCdevkit)下,之后:
1、创建目录
在根目录(.../VOCdevkit)下输入命令行命令python create_dir.py
会创建出以下样式的目录结构:
└── VOCdevkit #根目录
└── VOC2007
├── Annotations #存放xml文件,与JPEGImages中的图片一一对应,解释图片的内容等等
├── ImageSets
│ ├── Action
│ ├── Layout
│ ├── Main
│ └── Segmentation
├── JPEGImages #存放源图片
├── SegmentationClass #存放的是图片,语义分割相关
└── SegmentationObject #存放的是图片,实例分割相关
2、拷贝图片
将图片全部拷贝至JPEGImages中
或者,创建软连接到JPEGImages
总之,使得点击JPEGImages文件夹后的内容就是数据集的图片
3、生成Annotations文件夹中xml文件
在根目录(.../VOCdevkit)下输入命令行命令$ python create_annotations.py
PS:需要先修改下文件内容的四处(已在代码行后标注)
import os, sys
import glob
from PIL import Image
label_lists = []
img_lists = []
src_label_dir = '/mnt/B/nwpu/labelTxt/' ###指向自己数据集的labelTxt文件夹
src_img_dir = '/mnt/B/nwpu/images/' ###指向自己数据集的images文件夹
out_xml_dir = '/mnt/D/yuangan/datasets/nwpu/VOC2007/Annotations/' ###指向voc数据集的Annotations文件夹
# write in xml file
# os.mknod(src_xml_dir + '/' + img + '.xml')
xml_file = open((out_xml_dir + '/' + name + '.xml'), 'w')
xml_file.write('<annotation>\n')
xml_file.write(' <folder>VOC2007</folder>\n')
xml_file.write(' <filename>' + str(name) + '.png' + '</filename>\n') ###若准备的图片为jpg格式则将png替换为jpg
xml_file.write(' <size>\n')
xml_file.write(' <width>' + str(width) + '</width>\n')
xml_file.write(' <height>' + str(height) + '</height>\n')
xml_file.write(' <depth>3</depth>\n')
xml_file.write(' </size>\n')
xml_file.close()
for label_item in label_lists:
4、确定voc数据集的训练集与测试集
将自己数据集中的test.txt和train.txt拷贝到/ImageSets/Main下,并将test.txt改名成testval.txt
至此,数据集格式转化完成
二、用mmdetection训练faster_rcnn和ssd网络
以下操作均在进入mmdetection项目目录(.../mmdetection)里完成
1、修改配置文件
1.1、配置检测类别
打开mmdet/datasets/voc.py
将红框内容修改成数据集中的类别
1.2、配置图片格式
打开mmdet/datasets/xml_style.py
红框内容按照图片是jpg格式还是png格式修改
2、训练方法
训练很简单,利用官方给出的命令:
python tools/train.py ${CONFIG_FILE}
{CONFIG_FILE}文件存放在configs/pascal_voc中
比如用faster_rcnn网络训练:
python tools/train.py configs/pascal_voc/faster_rcnn_r50_fpn_1x_voc0712.py
用ssd训练:
python tools/train.py configs/pascal_voc/ssd512_voc.py
3、更改训练好的模型的存放目录
训练好的网络存放地址默认在mmdetection/work_dir,若要指定存放目录则在命令后加入--work_dir ${YOUR_WORK_DIR}
如:
python tools/train.py configs/pascal_voc/faster_rcnn_r50_fpn_1x_voc0712.py --work_dir /home/jokery/project/mmdetection/work_dirs/dota_faster_rcnn/