1. VOC_Aug(增强数据集)
近期看到很多论文都提到了,自己使用的是“we use augmented data with the annotation of XXX result in 10582 ,1449 and 1456 for training,validation and testing” 也就是 “Semantic contours from inverse detector” 这篇文章提出的一个对于VOC2011数据集等一个额外增加的数据集。
“Semantic contours from inverse detector” 这篇文章提到的数据集也是通常大家称之为“SBD”,位于这个网站,上面还有一些专门的说明:
http://home.bharathh.info/pubs/codes/SBD/download.html,那么下载下来之后就会发现,这个名叫benchmark的文件夹里train.txt内只包含了8498个图像,val.txt中包含了2857个图像,而且这个网上说了,这个训练集包含了部分验证集中的图像。
那么这个10582到底怎么来的呢,pascal的官网上也没有这个下载链接,找了好久之后,我终于在某个好心人的博客中找到了结果,他还提供了下载链接,这是好心人的博客地址。
http://www.sun11.me/blog/2018/how-to-use-10582-trainaug-images-on-DeeplabV3-code/
下载地址需要VPN,pascal_voc_train_aug.txt 位于这个网页中,直接拷贝然后创建一个train.txt粘贴上去就完成了,得到了10582 个训练图片路径https://gist.githubusercontent.com/sun11/2dbda6b31acc7c6292d14a872d0c90b7/raw/5f5a5270089239ef2f6b65b1cc55208355b5acca/trainaug.txt
原始图像位于“VOCdevkit/VOC2012/JPEGImages”文件夹下,把pascal_voc_train_aug.txt 放到 “VOCdevkit/VOC2012/ImageSets”文件夹下,验证集和测试集直接就是VOC2012数据集下载下来的那两个。
标注,也就是labels下载需要翻墙“https://www.dropbox.com/s/oeu149j8qtbs1x0/SegmentationClassAug.zip?dl=0”名称为SegmentationClassAug直接解压放到“VOCdevkit/VOC2012/”就完成了。
VOC 原始数据图像格式为xxx.jpg,图像标签 label格式为xxx.png
2. 图像分割Deeplab v3+中VOC2012数据集转成TFrecord格式,
deeplab v3+源码:
https://github.com/tensorflow/models/tree/master/research/deeplab
Recommended Directory Structure for Training and Evaluation(建议路径设置)
+ datasets
+ pascal_voc_seg
+ VOCdevkit
+ VOC2012
+ JPEGImages
+ SegmentationClass
+ SegmentationClassRaw
+ SegmentationClassAug
+ SegmentationObject
+ tfrecord
+ exp
+ train_on_train_set
+ train
+ eval
+ vis
3. 总结
增强版的VOC2012,用于做语义识别,图像分割的共有12031张原图和标签,可在百度网盘的链接下载: https://pan.baidu.com/s/1POhxt2Oket1S0rUT9cPFSQ 提取码: 5rfg
下载解压可以得到如下文件(夹):
JPEGImages:文件夹,包含17125张图片,其中12031张用于这个语义分割的任务
SegmentationClassAug:文件夹,包含12031张标签图片(需要是灰度图格式)
test.txt
train.txt
train_aug.txt
trainval.txt
trainval_aug.txt
val.txt
下载地址: