这篇文章的目的同样是试图提取出视频中对于步态识别比较关键的特征。不同之处在于,除了外观和姿态特征,作者认为,外观特征中应该还包含一类对于每个检测目标来说比较独特的静态特征,比如肢体相对于躯干的长度、躯体的形状等等。因此,本文使用基于CNN的网络,将提取出来的特征分为三类:Appearance feature,Canonical feature,Pose feature.本文使用一个encoder来将视频特征分为三类,为了保证提取出来的特征是有效的,同时采用一个decoder来将特征还原成原始状态。为了确保提取出来的fa和fc是有效的,因为fa和fc应该是静态的,decoder的输入是t1时刻帧的fa和fc,以及t2时刻的fp,来对t2时刻的帧进行还原。最终得到的fc是从视频序列每一帧中提取出来的fc的平均,同时使用lstm,将每一帧的fp变为一个序列进行最终的识别。
On Learning Disentangled Representations for Gait Recognition
©著作权归作者所有,转载或内容合作请联系作者
- 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
- 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
- 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
推荐阅读更多精彩内容
- 摘要:我们研究了使用CNN提取人体动作识别整个视频的特征表示问题。由于GPU内存的限制,目前整个视频尚无法进行CN...
- Abstract 这是华中科技大学的一篇关于行人重识别的文章,去年挂在arxiv上,今年更新了第二版。文章表示目前...
- 写在前面 未经允许,不得转载,谢谢~~~ 这篇文章是出自ICCV2017的一篇文章,在视频识别领域中属于用3D C...
- 一、Visual Tracking领域 最近因为团队业务需要,涉及实时视频流中Object Tracking技术,...
- What did authors try to accomplish? 这篇论文作者使用Disentangl...