Real-Time Human Pose Recognition in Parts from Single Depth Images

Abstract We propose a new method to quickly and accurately predict 3D positions of body joints from a single depth image, using no temporal information. We take an object recognition approach, designing an intermediate body parts representation that maps the difficult pose estimation problem into a simpler per-pixel classification problem. Our large and highly varied training dataset allows the classifier to estimate body parts invariant to pose, body shape, clothing, etc. Finally we generate confidence-scored 3D proposals of several body joints by reprojecting the classification result and finding local modes. The system runs at 200 frames per second on consumer hardware. Our evaluation shows high accuracy on both synthetic and real test sets, and investigates the effect of several training parameters. We achieve state of the art accuracy in our comparison with related work and demonstrate improved generalization over exact whole-skeleton nearest neighbor matching.

导读

论文提出了一种从单张深度图片中实时识别人体姿态的方法。主要思路是将这个问题转化成从单张深度图片识别每个像素属于身体的那个部位以及对识别出来的身体部位进行3维关节点重建问题。

图1: 从单张输入的审图图片,推断每个像素点从属的身体部位

我们主要关注论文中如何使用随机森林解决第一步转化:从深度图片来识别身体部位

训练数据的采集

如何得到大量,多样的训练数据是问题的关键。限制有二,使用计算机图形技术生成的真实图像会受到大量的颜色和纹理的影响,使得原始数据的有效信息退化成二维剪影信息,即使深度相机可以避免颜色纹理的影响,但是人体和衣服的形状各样性仍不能很好收集完全。

论文基于原始深度相机采集的图像,结合人物模型特性轻微改变身高和体重来生成更多的合成图像,以此来覆盖更多的人体形状。合成图像的目标是真实和多样。此外,结合用户的使用场景,论文的数据采集目标是覆盖人可能在娱乐场景中做出来的各种姿势。事实上,并不需要采集所有可能的姿态的组合数据,只要采集到大量范围广的的姿态信息就足够了。对采集的连续姿态序列,姿态之间相似冗余,因而使用定义了姿态间的欧式距离舍弃其中的部分冗余数据

此外,为了进一步完善先前采集数据的缺失信息,可以迭代采集过程,不断完善数据库

特征表达

论文使用深度比对来生成图像 I 中某一个像素 \mathbf{x} 的特征。

  • 首先,对于像素 \mathbf{x} ,定义一组位移探针 \theta = (\mathbf{u}, \mathbf{v}) 来获取像素 x 附近两个位置的深度差异。
  • 基于 \mathbf{u/v} 生成的两个像素点可以表示成,\mathbf{x}+\frac{\mathbf{u}}{d_I(\mathbf{x})}\mathbf{x}+\frac{\mathbf{v}}{d_I(\mathbf{x})}
  • 两个像素探针的深度差可以计算如下

图2: 像素探针的深度差计算

其中, 是通过正则化确保特征是深度无关的信息。

实验中,对于每张图片,每个像素点,定义了 2000 组这样的探针,每个探针 \theta 构成了该像素点的其中一个特征,也即生成了2000个特征。

每个单独的特征只提供了很弱的信号可以指示像素属于身体的哪个部位。但是对随机森林来说,这足够让这些特征组合提供足够的信息来准确分辨各个身体部分。

图3: 深度图片特征

Insights

  • a highly varied and large training set is required.
  • 基于原始数据合成覆盖更广更多的数据。要求合成的数据真实且多样。
  • 采集训练数据结合具体的测试场景。
  • 对于RF,训练数据不需要穷尽所有的组合,只要数据分布广数量足够即可。
  • 使用 furtherst neighbor clustering 丢弃相似冗余的数据。
  • 迭代采样,弥补缺失训练数据
  • 特征表达:使用足量的特征,每个特征提供(即使微弱的)信号
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 205,236评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,867评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,715评论 0 340
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,899评论 1 278
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,895评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,733评论 1 283
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,085评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,722评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 43,025评论 1 300
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,696评论 2 323
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,816评论 1 333
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,447评论 4 322
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,057评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,009评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,254评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,204评论 2 352
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,561评论 2 343

推荐阅读更多精彩内容