阅读《Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition》

一：本文的目的

如题目所说的，本文的主要工作是提出一个深度逐步改进的强化学习方法来做基于骨架的动作识别。说白了，就是做基于骨架数据的动作识别。

Selection_075.png

如上图所示，给定一个输入：vedio，然后最终目的是输入一个标签能判断这个视频中的模型在做什么动作。

思路简单概括为：

我们的输入是一段视频，视频中有多个帧。
我们想用RL的算法来选择关键帧（本文是FDNet）
再把选取到的关键帧输入到GCNN网络，得到这个vedio的标签

二：定义问题的决策链

由于要用RL来解决问题，那么就需要先把问题转化为一个决策链的问题

已知输入的是含有多个帧的一段视频，但我们不要全部用到全部帧数
所以我们想提取关键帧，设定提取的关键帧数为 $m$ ,把这 $m$ 个关键帧按序号排序，每一个action表示这些关键帧是要向左移动，向右移动或是保持当前位置。
设定迭代步数，当程序迭代步数达到设定值时，就停止程序

Selection_076.png

三： State and Action

State

针对选关键帧这个MDP问题，状态 $S$ 可以表示为：
$\{S_a, S_b\}$
即它由来两部分组成，其中 $S_a=[F,M]$ 也是由两部分组成的。 $F$ 表示整个视频的信息，它张量的形状为： $f \times N \times 3$ 。其中 $f$ 表示视频的所有帧数， $N$ 表示每一帧中的骨架模型的节点数， $3$ 表示每一个骨架节点的3D坐标。如下图所示是一个拍手动作的其中三帧，每一帧都是用一些骨架信息表示，其中包含了骨架中有多少个关节节点以及它们的3D坐标。

Selection_079.png
对于 $M$ 就表示所有被提取的关键帧信息，用一个形如 $m\times N \times 3$ 的张量表示，其中 $m$ 表示关键帧的数目
最后 $S_b$ one-hot, 它对应到整个视频的每一帧，如果对应的元素值为1,那么说明该帧被提取为关键帧，其余则为0

Selection_077.png

Action

action的动作由FDNet输出
action的定义比较简单：

帧向左移动
帧向右移动
帧保持不动

现在，我们打开看一下FDNet网络的结构

Selection_078.png

上图的执行流程如下

$S_b$ 经过一个全连接层得到一段向量
$S_a$ 经过3层卷积后，在经过一层全连接层得到另一段向量
将上面两个结果合并起来，通过一个全连接层输出结果
输出的结果由3个3个神经元组成，每一组神经元表示对应关键帧的action分布

四： Reward function

Selection_075.png

在本文的算法框架下，reward是由GCNN产生的（GCNN是什么下面说）
GCNN拿 $m$ 个关键帧作为一个输入
初步的reward可以表示为： $r_0 = sgn(P_{n,c} - P_{{n-1},c})$
其中 $c$ 是视频标签的ground truth
此外，我们还需要对reward做一些改善：如果预测的action是从不正确的关键帧跳到正确的关键帧，那么就会追加一个大的奖励，如果预测的action是从正确的关键帧跳到不正确的关键帧，那么就会给一个大的惩罚。最后reward表示如下
$\quad r = \left\{\begin{aligned} &\Omega , &\text{if stimulation} \\ &-\Omega , &\text{if punishment} \\ &r_0 , &\text{otherwise} \end{aligned}\right.$

五： GCNN

GCNN 是基于图的卷积

1.首先，我们看看图是如何构建出来的：
$\quad \omega_{ij} = \left\{\begin{aligned} &0, &\text{ if }i=j \\ &\alpha, &\text{if joint } i \text{ and joint } j \text{ are connected} \\ &\beta, &\text{if joint } i \text{ and joint } j \text{ are disconnected} \end{aligned}\right.$
我们根据上面的公式来构建图。为什么关节不相互连接都要给权重呢？比如看下面这个拍手的动作，左右手虽然没有相互连接，但是它们之间是有一定的位置关系的，即能体现出拍手这么个动作信息

Selection_079.png

图的卷积
1. 首先，给定 T 个关键帧，根据上面第一点提到的公式构建图 $[\mathcal{G}_1, \mathcal{G}_2,...,\mathcal{G}_T]$
2. 对每一个图，都进行卷积操作： $z_t = y(\eta , W)*x_t$
3. 卷积过后再用全连接层处理，得到一个输出向量 $g_t$
4. 最后把所有的输出向量合并起来 $G=concat[g_1,g_2,...,g_T]$

GCNN的输出
对于2的输出结果，用熵函数作用后，就得到了我们的reward(训练时作为reward，测试时作为标签)

算法和实验

Selection_080.png

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,496评论 6赞 501
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,407评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,632评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,180评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,198评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,165评论 1赞 299
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,052评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,910评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,324评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,542评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,711评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,424评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,017评论 3赞 326
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,668评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,823评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,722评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,611评论 2赞 353