在使用tensorflow
进行数据训练时,由于原图片文件名较繁琐,且由于根据原图片名生成的xml
标签文件中生成了包含filename
的标签属性,不利于后期测试训练效果,故通过Python
代码对图片名和xml
文件信息进行批量修改为由0开始的顺序递增文件名,以配合后期的测试工作,在此记录下。首先,这是图片名称和xml
文件信息:
图片文件名:
标签文件名:
xml信息:
Python代码如下:
#coding:utf-8
from PIL import Image
import os.path
import glob
import xml.etree.ElementTree as ET
import xml.dom.minidom
i = 0
xmldir = "E:\\object-detection-Game-2018-5-31\\xmls"
imgsdir = "E:\\object-detection-Game-2018-5-31\\imgs"
outdir = "E:\\object-detection-Game-2018-5-31\\imgs"
for xmlfile in os.listdir(xmldir):
xmlname = os.path.splitext(xmlfile)[0]
for pngfile in os.listdir(imgsdir):
pngname = os.path.splitext(pngfile)[0]
if pngname == xmlname:
# 修改图片文件名
# 图片文件名修改前后的路径
olddir = os.path.join(os.path.abspath(imgsdir), pngname + ".png")
newdir = os.path.join(os.path.abspath(imgsdir), str(i)+".png")
os.rename(olddir, newdir)
print(xmlfile, '----->', str(i) + '.png')
# 修改filename结点属性
# 读取xml文件
dom = xml.dom.minidom.parse(os.path.join(xmldir, xmlfile))
root = dom.documentElement
# 获取标签对filename之间的值并赋予新值i
root.getElementsByTagName('filename')[0].firstChild.data = str(i) + '.png'
# 将修改后的xml文件保存
# xml文件修改前后的路径
old_xmldir = os.path.join(xmldir, xmlfile)
new_xmldir = os.path.join(xmldir, str(i)+'.xml')
# 打开并写入
with open(old_xmldir, 'w') as fh:
dom.writexml(fh)
os.rename(old_xmldir, new_xmldir)
i += 1
print('total number is ', i)
运行结果如下:
修改后的文件信息: