Deep Progressive Reinforcement Learning for Skeleton-based Action Recognition

motivation

  • 对于不同的视频序列,挑出最有代表性的帧的方法是不同的,因此,本文提出用深度增强学习来将帧的选择模拟为一个不断进步的progressive process。
  • 强化学习是通过优化选择actions的policy来最大化agent从environment所获得的rewards。文章中说至今为止,在动作识别领域,增强学习的应用还不多。

方法

  • 本文的人体关节邻接矩阵是这么设计的:如果两个关节有连接,就在邻接矩阵相应位置标记为α,称之为intrinsic dependencies,否则标记为β,称之为extrinsic dependencies。此外关节没有self connection,是邻接矩阵对角元素全是0.
  • 思路简单概括为:
    1.输入是一段视频,视频中有多个帧
    2.用RL的算法来选择关键帧(本文是FDNet)
    3.再把选取到的关键帧输入到GCNN网络,得到这个vedio的标签

定义问题的决策链

  • 已知输入的是含有多个帧的一段视频,但我们不要全部用到全部帧数
  • 我们想提取关键帧,设定提取的关键帧数为m,把这m个关键帧按序号排序,每一个action表示这些关键帧是要向左移动,向右移动或是保持当前位置。
  • 设定迭代步数,当程序迭代步数达到设定值时,就停止程序;


State and Action

State

  1. 针对选关键帧这个MDP问题,状态S可以表示为: {Sa,Sb}
  2. Sa=[F,M] 也是由两部分组成的。F表示整个视频的信息, 它张量的形状为:f×N×3。 其中f表示视频的所有帧数,N表示每一帧中的骨架模型的节点数,3表示每一个骨架节点的3D坐标。
  3. M就表示所有被提取的关键帧信息,用一个形如m×N×3的张量表示,其中m表示关键帧的数目.
    4.Sb one-hot, 它对应到整个视频的每一帧,如果对应的元素值为1,那么说明该帧被提取为关键帧,其余则为0

Action

action的动作由FDNet输出
action的定义比较简单:
1.帧向左移动
2.帧向右移动
3.帧保持不动


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 一: 本文的目的 如题目所说的,本文的主要工作是提出一个深度逐步改进的强化学习方法来做基于骨架的动作识别。说白了,...
    winddy_akoky阅读 1,353评论 0 1
  • /**转载自https://blog.csdn.net/xiaoxiaowenqiang/article/deta...
    Maxsium阅读 662评论 0 0
  • 个人为了看的方便没有广告,转载自泡泡机器人:https://www.sohu.com/a/161346283_71...
    Maxsium阅读 39,094评论 0 8
  • 国家电网公司企业标准(Q/GDW)- 面向对象的用电信息数据交换协议 - 报批稿:20170802 前言: 排版 ...
    庭说阅读 11,186评论 6 13
  • 我在镇上上的初中,初三的化学老师是陈老师,高高的,微胖,人很和蔼。听说是学校教师里的老本科生,听说他高考英语不好,...
    吴宁_16ee阅读 247评论 0 1