最近想到一个问题就是现在用的比较多的都是静态图像的识别(人脸、骨骼、分类这些)。但是一些信息是静帧不具备的,需要一段时间的视频才能得到,比如检测超市是否有人偷东西。所以就想是否有类似图片人脸识别的AI模型可以识别视频呢?
去搜了下论文,发现google有一个这方面的论文
https://arxiv.org/pdf/1705.07750
进一步发现其实有一些已经实现的工具,比如这个MMAction2 。
然后发现原来已经有一些视频的数据集
最近想到一个问题就是现在用的比较多的都是静态图像的识别(人脸、骨骼、分类这些)。但是一些信息是静帧不具备的,需要一段时间的视频才能得到,比如检测超市是否有人偷东西。所以就想是否有类似图片人脸识别的AI模型可以识别视频呢?
去搜了下论文,发现google有一个这方面的论文
https://arxiv.org/pdf/1705.07750
进一步发现其实有一些已经实现的工具,比如这个MMAction2 。
然后发现原来已经有一些视频的数据集