从labelme标签到COCO数据集制作

COCO数据集:

  1. 官网数据下载
    面对官网下载界面无法打开问题,此处直接提供下载链接。一组数据包括一个train包,一个val包和一个annotations包。
    2014coco数据 train2014.zip val2014.zip annotations_trainval2014.zip
    2017coco数据 train2017.zip val2017.zip annotations_trainval2017.zip
    测试数据 test2014.zip test2015.zip test2017.zip

  2. 将coco数据集以文件夹格式存放:
    笔者面向目标检测faster RCNN场景,所以此处先研究instances格式,其他评估集,人体关键点集也都类似。

COCO/DIR/
       annotations/
             instances_train201?.json
             instances_val201?.json
       train201?/
             # image files that are mentioned in the corresponding json
       val201?/
             # image files that are mentioned in corresponding json
  1. coco格式:
    数据整体格式
{
    'info': info,
    'images': [image],
    'licenses': [license],
    'annotations': [annotation],
    'categories': [category] 
}

以2014数据为例,读取instances_train2014.json数据信息。

 import json
data = json.load(open('instances_train2014.json'))
data.keys()
# dict_keys(['info', 'images', 'licenses', 'annotations', 'categories'])
data['info']
# {'description': 'COCO 2014 Dataset', 'url': 'http://cocodataset.org', 'version': '1.0', 'year': 2014, 'contributor': 'COCO Consortium', 'date_created': '2017/09/01'}
data['images'][0]
# {'license': 5, 'file_name': 'COCO_train2014_000000057870.jpg', 'coco_url': 'http://images.cocodataset.org/train2014/COCO_train2014_000000057870.jpg', 'height': 480, 'width': 640, 'date_captured': '2013-11-14 16:28:13', 'flickr_url': 'http://farm4.staticflickr.com/3153/2970773875_164f0c0b83_z.jpg', 'id': 57870}
data['licenses'][0]
# {'url': 'http://creativecommons.org/licenses/by-nc-sa/2.0/', 'id': 1, 'name': 'Attribution-NonCommercial-ShareAlike License'}
data['annotations'][0]
# {'segmentation': [[312.29, 562.89, 402.25, 511.49, 400.96, 425.38, 398.39, 372.69, 388.11, 332.85, 318.71, 325.14, 295.58, 305.86, 269.88, 314.86, 258.31, 337.99, 217.19, 321.29, 182.49, 343.13, 141.37, 348.27, 132.37, 358.55, 159.36, 377.83, 116.95, 421.53, 167.07, 499.92, 232.61, 560.32, 300.72, 571.89]], 'area': 54652.9556, 'iscrowd': 0, 'image_id': 480023, 'bbox': [116.95, 305.86, 285.3, 266.03], 'category_id': 58, 'id': 86}
data['categories'][0]
# {'supercategory': 'person', 'id': 1, 'name': 'person'}

labelme标签制作:

  1. 安装labelme
pip install labelme
  1. 安装好后直接在终端输入labelme即可打开其图形界面。然后点击界面左边open dir加载图片数据集的文件夹。


    labelme界面

    然后再选择界面左方create polygons标记多边形,并点击save保存在与图片同一路径下



    然后选择下一张图片,继续标注,然后保存,标注完成时,一张图片应对应一个json文件。

labelme标签制作COCO数据集:

  1. 下载labelme源码
    需要使用labelme源码中的一个example转换json。
git clone https://github.com/wkentaro/labelme.git

进入文件夹labelme/examples/中,将文件夹instance_segmentation文件夹拷贝,然后进入其中,将生成好的labelme文件放入data_annotated中,删除data_dataset_coco文件夹,打开labels.txt文件,按照自己的标签更改其中的类别。
执行labelme2coco.py 形成新的data_dataset_coco文件夹。

python labelme2coco.py data_annotated data_dataset_coco --labels labels.txt

读取新生成的annotations文件,与原coco数据集中的annotations文件进行对比,一致。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,657评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,662评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,143评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,732评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,837评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,036评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,126评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,868评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,315评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,641评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,773评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,859评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,584评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,676评论 2 351

推荐阅读更多精彩内容