阅读《Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition》

一: 本文的目的

如题目所说的,本文的主要工作是提出一个深度逐步改进的强化学习方法来做基于骨架的动作识别。说白了,就是做基于骨架数据的动作识别。

Selection_075.png

如上图所示,给定一个输入:vedio,然后最终目的是输入一个标签能判断这个视频中的模型在做什么动作。

思路简单概括为:

  1. 我们的输入是一段视频,视频中有多个帧。
  2. 我们想用RL的算法来选择关键帧(本文是FDNet)
  3. 再把选取到的关键帧输入到GCNN网络,得到这个vedio的标签

二: 定义问题的决策链

由于要用RL来解决问题,那么就需要先把问题转化为一个决策链的问题

  1. 已知输入的是含有多个帧的一段视频,但我们不要全部用到全部帧数
  2. 所以我们想提取关键帧,设定提取的关键帧数为m,把这m个关键帧按序号排序,每一个action表示这些关键帧是要向左移动,向右移动或是保持当前位置。
  3. 设定迭代步数,当程序迭代步数达到设定值时,就停止程序
Selection_076.png

三: State and Action

State

  1. 针对选关键帧这个MDP问题,状态S可以表示为:
    \{S_a, S_b\}

  2. 即它由来两部分组成,其中S_a=[F,M] 也是由两部分组成的。F表示整个视频的信息, 它张量的形状为:f \times N \times 3。 其中f表示视频的所有帧数,N表示每一帧中的骨架模型的节点数,3表示每一个骨架节点的3D坐标。 如下图所示是一个拍手动作的其中三帧,每一帧都是用一些骨架信息表示,其中包含了骨架中有多少个关节节点以及它们的3D坐标。

    Selection_079.png

  3. 对于M就表示所有被提取的关键帧信息,用一个形如m\times N \times 3的张量表示,其中m表示关键帧的数目

  4. 最后S_bone-hot, 它对应到整个视频的每一帧,如果对应的元素值为1,那么说明该帧被提取为关键帧,其余则为0

    Selection_077.png

Action

action的动作由FDNet输出
action的定义比较简单:

  1. 帧向左移动
  2. 帧向右移动
  3. 帧保持不动

现在,我们打开看一下FDNet网络的结构

Selection_078.png

上图的执行流程如下

  1. S_b经过一个全连接层得到一段向量
  2. S_a经过3层卷积后,在经过一层全连接层得到另一段向量
  3. 将上面两个结果合并起来,通过一个全连接层输出结果
  4. 输出的结果由3个3个神经元组成,每一组神经元表示对应关键帧的action分布

四: Reward function

Selection_075.png
  1. 在本文的算法框架下,reward是由GCNN产生的(GCNN是什么下面说)

  2. GCNN拿m个关键帧作为一个输入

  3. 初步的reward可以表示为:r_0 = sgn(P_{n,c} - P_{{n-1},c})
    其中c是视频标签的ground truth

  4. 此外,我们还需要对reward做一些改善: 如果预测的action是从不正确的关键帧跳到正确的关键帧,那么就会追加一个大的奖励,如果预测的action是从正确的关键帧跳到不正确的关键帧,那么就会给一个大的惩罚。最后reward表示如下
    \quad r = \left\{\begin{aligned} &\Omega , &\text{if stimulation} \\ &-\Omega , &\text{if punishment} \\ &r_0 , &\text{otherwise} \end{aligned}\right.

五: GCNN

GCNN 是基于图的卷积

1.首先,我们看看图是如何构建出来的:
\quad \omega_{ij} = \left\{\begin{aligned} &0, &\text{ if }i=j \\ &\alpha, &\text{if joint } i \text{ and joint } j \text{ are connected} \\ &\beta, &\text{if joint } i \text{ and joint } j \text{ are disconnected} \end{aligned}\right.
我们根据上面的公式来构建图。为什么关节不相互连接都要给权重呢?比如看下面这个拍手的动作,左右手虽然没有相互连接,但是它们之间是有一定的位置关系的,即能体现出拍手这么个动作信息

Selection_079.png

  1. 图的卷积
    1. 首先,给定 T 个关键帧,根据上面第一点提到的公式构建图 [\mathcal{G}_1, \mathcal{G}_2,...,\mathcal{G}_T]
    2. 对每一个图,都进行卷积操作:z_t = y(\eta , W)*x_t
    3. 卷积过后再用全连接层处理,得到一个输出向量g_t
    4. 最后把所有的输出向量合并起来G=concat[g_1,g_2,...,g_T]
  1. GCNN的输出
    对于2的输出结果,用熵函数作用后,就得到了我们的reward(训练时作为reward, 测试时作为标签)

算法和实验

Selection_080.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,496评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,407评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,632评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,180评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,198评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,165评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,052评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,910评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,324评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,542评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,711评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,424评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,017评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,668评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,823评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,722评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,611评论 2 353

推荐阅读更多精彩内容

  • 国家电网公司企业标准(Q/GDW)- 面向对象的用电信息数据交换协议 - 报批稿:20170802 前言: 排版 ...
    庭说阅读 10,958评论 6 13
  • 平时懒洋洋地像是跑了气的可乐,可如果谁要欺负到她在乎的人头上,就像是被摇晃后的可乐,恨不得去找人拼命,又温柔又爆裂...
    有文化的小白兔阅读 185评论 0 0
  • 不要因为别人的一句话随便改变自己。
    西岸阅读 134评论 0 0
  • 时间真快,掐指一算,我也结婚十多年了。大闺女快十四岁了,儿子也五岁半了,虽然结婚后没有和公婆住在一起,但我们相处的...
    阳光_986c阅读 2,193评论 11 36
  • 你问我游荡在哪个地方 我回答:在大理古城的人民路 我从随缘书店出来 向苍山那个方向回去 我看见了一颗星 若隐若现的...
    洛之亦阅读 252评论 0 4