时空动作检测 (spatio-temporal action detection)

时空动作检测 (spatio-temporal action detection) : 输入一段视频,不仅需要识别视频中动作出现的区间和对应的类别,还要在空间范围内用一个包围框 (bounding box)标记出人物的空间位置。

一、算法介绍

  • ACT (《Action Tubelet Detector for Spatio-Temporal Action Localization》)
  • YOWO(《You Only Watch Once: A Unifified CNN Architecture for Real-Time Spatiotemporal Action Localization》)
  • MOC(《Actions as Moving Points》)
  • ACAR-Net(《《Actor-Context-Actor Relation Network for Spatio-Temporal Action Localization》》)

二、常用数据集介绍

2.1 AVA

数据集全称 Atomic Visual Actions,在CVPR2018公布,该数据集是用来做时空行为检测的,即检测出视频中所有人的位置以及对应的行为类别。

数据形式:

  1. 数据来源于Youtube中的电影

  2. 每个电影只标值第15-30分钟内的视频

  3. 总共430个视频,分为235个训练,64个验证,131个测试

  4. 标记的内容包括人物的bbox,以及每个人的行为类别,同一时间同一人可能有多个行为

  5. 标记的内容还包括每个实体编号,即相邻关键帧中的人物如果是同一个人,则拥有相同的实体编号。换句话说,“实体编号”其实就是目标跟踪的标签。

  6. 数据集中只对关键帧进行标记,所谓的关键帧是指每隔一秒作为一个关键帧

  7. 行为类别有80类(evaluate的时候只用到其中的60类),80类标签分为三类(person movement、object manipulation、person interaction)。具体如下:

    * person movement
        bend/bow (at the waist)、crawl、crouch/kneel、dance、fall down、get up、jump/leap、lie/sleep、martial art、run/jog、sit、stand、swim、walk
        
    * object manipulation
        answer phone、brush teeth、carry/hold (an object)、catch (an object)、chop、climb (e.g., a mountain)、clink glas 、close (e.g., a door, a box)、cook、cut、dig、dress/put on clothing、drink、drive (e.g., a car, a truck)、eat、enter、exit、extract、fishing、hit (an object)、kick (an object)、lift/pick up、listen (e.g., to music)、open (e.g., a window, a car door)、paint、play board game、play musical、instrument、play with pets、point to (an object)、press、pull (an object)、push (an object)、put down、read、ride (e.g., a bike, a car, a horse)、row boat、sail boat、shoot、shovel、smoke、stir、take a photo、text on/look at a cellphone、throw、touch (an object)、turn (e.g., a screwdriver)、watch (e.g., TV)、work on a computer、write
        
    * person interaction
        fight/hit (a person)、give/serve (an object) to (a person)、grab (a person)、hand clap、hand shake、hand wave、hug (a person)、kick (a person)、kiss (a person)、lift (a person)、listen to (a person)、play with kids、push (another person)、sing to (e.g., self, a person, a group)、take (an object) from (a person)、talk to (e.g., self, a person, a group)、watch (a person)
    

2.2 J-HMDB-21

数据集全称Joint-annotated Human Motion Data Base,该数据是HMDB-51数据集的一个子集。

2.2.1 HMDB-51

该数据集文章名为HMDB: A Large Video Database for Human Motion Recognition. ,发布于ICCV2011,用于动作识别领域(action recognition)。

数据集形式:

  1. 该数据集的视频是从多个地方采集的,大部分来源于电影,一小部分来源于YouTube和Google videos等。

  2. 数据集总共有裁切好的6849个片段的,并将所有的片段分为51个动作类别,每个类别至少有101个视频片段。

  3. 类别分为下列五种:

    * general facial actions
        smile、laugh、chew、talk
    
    * facial actions with object manipulation
        smoke、eat、drink
    
    * General body movements
        cartwheel, clap hands, climb, climb stairs, dive, fall on the floor, backhand flip, handstand, jump, pull up, push up, run, sit down, sit up, somersault, stand up, turn, walk, wave.
        
    * Body movements with object interaction
        brush hair, catch, draw sword, dribble, golf, hit something, kick ball, pick, pour, push something, ride bike, ride horse, shoot ball, shoot bow, shoot gun, swing baseball bat, sword exercise, throw.
        
    * Body movements for human interaction
        fencing, hug, kick someone, kiss, punch, shake hands, sword fight.
    

2.2.2 J-HMDB-21

该数据库文章名为Towards understanding action recognition,发表于ICCV2013。

数据集形式:

  1. 该数据集是从HMDB-51中选取了960个视频片段,这些视频片段属于不同的21个类别。

  2. 该数据集是每帧都进行标注

  3. 每个视频最多只有一类目标行为,bbox只标了做目标行为的那几个人

  4. 数据集中的21类为:

    sit、run、pullup、walk、shoot_gun、brush_hair、jump、pour、pick、kick_ball、golf、shoot_bow、catch、clap、swing_baseball、climb_stairs、throw、wave、shoot_ball、push、stand
    

2.3 UCF101-24

数据集UCF101-24是数据集UCF101的一个子集

2.3.1 UCF101

该数据集文章名为UCF101: A Dataset of 101 Human Actions Classes From Videos in The Wild,该数据集又是UCF50的扩充,该数据主要是用于视频识别领域。

数据集形式:

  1. 数据集包含了13320个裁剪好的视频片段

  2. 所有的视频都来源于YouTube,帧率为25fps,分辨率为320\times 240

  3. 该数据集中的类别分为5大类 (Body motion、 Human-human interactions、Human-object interactions、 Playing musical instruments and Sports)

  4. 该数据集总共有101个类别(BTW: UCF50意思就是该数据集有50个类别),分别为:

    Apply Eye Makeup, Apply Lipstick, Archery, Baby Crawling, Balance Beam, Band Marching, Basketball Dunk, Blow, Drying Hair, Blowing Candles, Body Weight Squats,Bowling,Boxing-Punching Bag, Boxing-Speed Bag, Brushing, Teeth, Cliff Diving, Cricket Bowling, Cricket Shot, Cutting In Kitchen, Field Hockey Penalty, Floor Gymnastics, Frisbee Catch, Front Crawl, Hair cut, Hammering, Hammer Throw, Handstand Pushups, Handstand Walking, Head
    Massage, Ice Dancing, Knitting, Long Jump, Mopping, Floor, Parallel Bars, Playing Cello, Playing Daf, PlayingDhol, Playing Flute, Playing Sitar, Rafting, Shaving Beard, Shot put, Sky Diving, Soccer Penalty, Still Rings, Sumo, Wrestling, Surfing, Table, Tennis Shot, Typing, Uneven Bars, Wall Pushups, Writing On Board
    

2.3.2 UCF101-24

数据集标注的下载点击,here

数据集形式:

  1. 该数据集每一帧都进行标注

  2. 每个视频最多只有一类行为,bbox只标做了目标行为的那几个人

  3. 数据集中的24类为:

    WalkingWithDog、Diving、PoleVault、SkateBoarding、CricketBowling、GolfSwing、Skijet、RopeClimbing、FloorGymnastics、Basketball、Biking、VolleyballSpiking、Fencing、CliffDiving、HorseRiding、SoccerJuggling、TennisSwing、LongJump、SalsaSpin、TrampolineJumping、IceDancing、Skiing、Surfing、BasketballDunnk
    
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,125评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,293评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,054评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,077评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,096评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,062评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,988评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,817评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,266评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,486评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,646评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,375评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,974评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,621评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,642评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,538评论 2 352

推荐阅读更多精彩内容