Video LSTM压缩结果

这都是压缩到了1s以内的结果,好坏参差不齐

比较好的结果

1.png
3.png
10.png

惨不忍睹的结果

8.png
9.png

还有一些目标不在正中位置的结果,没法表达出任何内容

2.png
6.png

总结

因为是强行压缩来减少帧数,所以这个模型选择的是保留分值最高的帧
测试集中有些视频连正常人看了也不知道该拿什么作为封面,不过这个模型的泛化能力可能有点差,它输出结果好的都是目标单一的,场景切换少的,,对于来回切换场景,多目标的视频,表现得都很烂。

下一步工作遇到的问题

如果想要拿我们自己的真实视频进行测试,有个一直困扰我们的问题,每一帧图片的特征提取。论文中提到是用GoogleNet pool5的输出值(1024维),,但我调过的代码都是2048维的,用的都是别人预训练过的模型,2048跟1024应该不单单是改一个数字就能解决了。

Paste_Image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Android 自定义View的各种姿势1 Activity的显示之ViewRootImpl详解 Activity...
    passiontim阅读 172,982评论 25 708
  • 在保证视频图像质量的前提下,HEVC通过增加一定的计算复杂度,可以实现码流在H.264/AVC的基础上降低50%。...
    加刘景长阅读 7,976评论 0 6
  • [TOC] 音视频&流媒体 是什么促使我要写这一篇音视频入门文章?那是因为和一妹子打赌码率的概念,结果输了;对一个...
    AllenWu阅读 4,899评论 1 24
  • 舒圣祥(微信公众号:书生香评) 一位原来报社的摄影记者,昨天突然跟我在微信里聊起了股票的事情。我很诧异,他居然也开...
    舒圣祥阅读 211评论 0 0
  • 通过python批量自动化下载斗破苍穹小说 效果是这样的 我的代码 总结 爬虫思路-获取多页访问链接->获取每页图...
    rmbnet阅读 1,532评论 3 5