本周学习
利用Openvino的开源插件Action Recognition复现《Lightweight Network Architecture for Real-Time Action Recognition》。但在浮现过程中发下了当下计划的问题。
发现问题
在一开始选择论文时,对Action Recognition的分类并不清楚,误以为Action Recognition就是单独一类。但这回毕设准备参考的论文《Lightweight Network Architecture for Real-Time Action Recognition》属于Video Action,而我的毕设方向是关键点的Action识别。这个问题是在复现该论文时,了解数据集内容的时候发现的。该论文的数据集没有关键点这一概念,且均为视频序列。当时感到疑惑,这才发现了区别。
但该论文的Transformer的思想我觉得很合理。这点我应该继续应用到我的工作中。
下周任务
寻找更合适的数据集。
在这些数据集的基础上有什么值得努力的方向、已有的研究?