人工智能AI工具-视频标注工具vatic的搭建和使用

一. 背景

人工智能，尤其是深度学习技术最近十分的火热。因为其已经在大数据和高运算能力(gpu,fpga)的前提下验证了在图片，语音，端到端强大的能力。根据徐伟的ppt，现阶段深度学习技术已经可以成熟的领域在于:【Andrew Ng/徐伟谈人工智能发展的现状与未来】

目前深度学习创造的价值，主要集中在监督学习问题(X->Y)。这些监督学习问题，并不仅局限于Y是布尔类型或者整数的情况，还扩展到更复杂的情形。比如：
图片摘要(Image Captioning) - X：图片， Y：摘要
机器翻译(Machine Translation) - X：英文文本，Y：法文文本
基于图像的问答(Image Query Answering) - X: (图像，问题)， Y：答案
语音识别(Speech Recognition) - X: 音频片段， Y：文本

与此同时，产业界也在迅猛的发展。【国内人工智能行业全梳理】中梳理了多个方向的进展。无疑，接下来深度学习会在更多的领域内落地，应用。我准备写一个系列的文章。来总结我在工作中接触到，使用过的相关工具，这包括：(1)数据集的构建：人工标注平台Vatic（2）数据集的分布式存储平台（3）深度学习平台训练工具MXNET（4）深度学习平台训练工具tensorflow。本文先介绍我使用过的一个视频/图片标注工具vatic。

二. Vatic介绍

Vatic源自MIT的一个研究项目(Video Annotation Tool from Irvine, California)。输入一段视频，支持自动抽取成粒度合适的标注任务并在流程上支持接入亚马逊的众包平台Mechanical Turk。除此之外，其还有很多实用的特性：

简洁使用的GUI界面，支持多种快捷键操作
基于opencv的tracking，这样就可以抽样的标注，减少工作量
具体使用时，可以设定要标注的物体label，比如：水果，人，车，等等。然后指派任务给到众包平台（也可是自己的数据工程师）。现阶段支持的标注样式是框（box）。一个示例，下图标注了NBA直播比赛中的运动员

篮球运动员标注数据示例

车辆标注数据示例

三. 使用docker搭建Vatic

搭建vatic可以参照github上的说明。搭建过程对操作系统和软件的版本要求较严格。所以，我们使用docker来部署降低复用的难度。
一个参考的docker image
https://github.com/johndoherty/vatic

docker pull jldowns/vatic-docker

启动服务

docker run -v "$PWD/data":/root/vatic/data
jldowns/vatic-docker /root/vatic/start_and_block.sh --name myvatic

四. vatic使用

从视频抽取目标图片集合, 内部使用了ffmpeg

turkic extract /path/to/video.mp4 /path/to/output/directory
默认是720x480的目标分辨率，也可以添加--no-resize来保证原图的图片质量

将图片load到数据库

turkic load identifier /path/to/output/directory Label1 Label2 LabelN --blow-radius 0 --skip 5 --offline
设置标注的label，每5帧标注1帧，不覆盖周围的帧数据

发布任务

turkic publish --offline

dump 标注后的元数据

turkic dump identifier -o output.txt
支持xml，json等多种格式

dump标注后的图片数据

turkic visualize identifier $output_path --merge --renumber
cd $output_path
ffmpeg -i %d.jpg -vcodec mpeg4 output.avi
支持导出带标注box的图片集合，并可以通过ffmpeg合成为一段完成的演示视频

最后编辑于：2017.12.03 05:14:42

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 204,590评论 6赞 478
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 86,808评论 2赞 381
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 151,151评论 0赞 337
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 54,779评论 1赞 277
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 63,773评论 5赞 367
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 48,656评论 1赞 281
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 38,022评论 3赞 398
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 36,678评论 0赞 258
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 41,038评论 1赞 299
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 35,659评论 2赞 321
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 37,756评论 1赞 330
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 33,411评论 4赞 321
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,005评论 3赞 307
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 29,973评论 0赞 19
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 31,203评论 1赞 260
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 45,053评论 2赞 350
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 42,495评论 2赞 343

人工智能AI工具-视频标注工具vatic的搭建和使用

一. 背景

二. Vatic介绍

三. 使用docker搭建Vatic

四. vatic使用

推荐阅读更多精彩内容