登录注册写文章

On Learning Disentangled Representations for Gait Recognition

On Learning Disentangled Representations for Gait Recognition

这篇文章的目的同样是试图提取出视频中对于步态识别比较关键的特征。不同之处在于，除了外观和姿态特征，作者认为，外观特征中应该还包含一类对于每个检测目标来说比较独特的静态特征，比如肢体相对于躯干的长度、躯体的形状等等。因此，本文使用基于CNN的网络，将提取出来的特征分为三类：Appearance feature,Canonical feature,Pose feature.本文使用一个encoder来将视频特征分为三类，为了保证提取出来的特征是有效的，同时采用一个decoder来将特征还原成原始状态。为了确保提取出来的fa和fc是有效的，因为fa和fc应该是静态的，decoder的输入是t1时刻帧的fa和fc，以及t2时刻的fp，来对t2时刻的帧进行还原。最终得到的fc是从视频序列每一帧中提取出来的fc的平均，同时使用lstm，将每一帧的fp变为一个序列进行最终的识别。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

[文献翻译]Deep Local Video Feature for Action Recog...
摘要：我们研究了使用CNN提取人体动作识别整个视频的特征表示问题。由于GPU内存的限制，目前整个视频尚无法进行CN...
夏迪End阅读 1,289评论 1赞 2
【论文精读】Deep-Person: Learning Discriminative Deep...
Abstract 这是华中科技大学的一篇关于行人重识别的文章，去年挂在arxiv上，今年更新了第二版。文章表示目前...
luuuyi阅读 2,402评论 0赞 0
论文 | P3D视频特征提取网络解读《learning spatio-temporal rep...
写在前面未经允许，不得转载，谢谢~~~ 这篇文章是出自ICCV2017的一篇文章，在视频识别领域中属于用3D C...
与阳光共进早餐阅读 13,564评论 12赞 21
【视觉跟踪Visual Tracking】 DL分支：MDNet—Learning Multi...
一、Visual Tracking领域最近因为团队业务需要，涉及实时视频流中Object Tracking技术，...
EdwardLee阅读 4,053评论 0赞 1
Gait Recognition via Disentangled Representatio...
What did authors try to accomplish？这篇论文作者使用Disentangl...
高冷的ID阅读 927评论 0赞 0

赞1赞

赞赏

手机看全文