视频封面生成论文1

To Click or Not To Click: Automatic Selection of Beautiful Thumbnails from Videos

ICKM 2016 Yale Song


Abstract

  • 1)研究目的:高质量视频封面对于影响用户观看网络视频的重要性
  • 2)成果简介:构建了这样的系统——综合画面的吸引力和对整个视频的代表度来进行视频摘要的生成(high relevance to video content and superior aesthetic quality)
  • 3)有效性验证:基于1118个视频的数据集,6种不同的摘要生成方法,由专家判断哪种由计算机生成
  • 4)对实验结果的分析:哪些美学特征对最终的结果影响较大(the selection of a good thumbnail is highly correlated with objective visual quality metrics, such as the frame texture and sharpness)

Introduction

对Abstract的进一步丰富,内容的组织逻辑和Abstract相同,结构为漏斗型。

  • 1)第一段给出较为详细的研究背景,用三篇参考文献佐证高质量封面的重要性
  • 2)第二段提出问题,需要有一种自动高效生成视频封面的方法,正式抛出本研究的目标——自动提取最适合作为视频缩略图的帧
  • 3)第三、四段给出成果的简介,先写原理再给出部分实现细节的描述,最后加上和已有方法的对比,解决了哪些问题或有哪些创新和优点——同时考虑了画面的吸引力和对整个视频的代表度
  • 4)第五段给出本研究的核心优点——需要的算力极小且高效,可以作为更复杂系统的模块进行扩展
  • 5)第六段给出本研究的验证方法,同样引用参考文献对比前人的成果,证明本方法更为可靠
  • 6)第七段给出实验结论中得到的额外信息——哪些美学特征对最终的结果影响较大
  • 8)第八段给出本文的核心贡献以及github链接

Related Work

本研究领域现有方法的综述,目的是映衬出本文的创新点
总结本文涉及到的研究领域——thumbnail selection, video highlighting and summarization, computational aesthetics

  1. Thumbnail selection:根据keyword来从现有的数据库中获得某类封面的特征,再从原视频中提取,总结基本上都是从代表性出发,没有考虑美学上的特征
  2. Video highlighting and summarization:基本思想为做主成分分析,LASSO稀疏编码得到作为基底的帧,除去有冗余信息的帧;提出本文的创新点,在考虑除去冗余的基础上加入美学特征的权重,再引出一批采用同样思路的论文进行比较,给出创新点——判断指标为帧的美学属性而非与groundtruth的相似度
  3. Computational aesthetics:已有的视频计算美学技术的简介,包括图片的美学计算、视频创意度、视频有趣度等,最后概括本文提出了首个以摘要为目的的计算模型,强调创新点。

Our Method

1)筛选掉低质量帧
2)通过聚类在每个镜头选取关键帧
3)再进行一次聚类,每一类中根据美学指标得到封面候选帧
4)根据类的大小对候选帧进行排序

1.Frame Filter

首先提出问题,对所有的帧进行计算太花时间,再提出解决问题的假设——所有适合作为封面的帧一定满足必要的美学指标,最后总结解决方案——对视频处理前先进行一轮筛选。

  1. Low-quality frames
    定义了三种低质量帧:dark, blurry, and uniform-colored,分别计算帧的明度、锐度和高灰度值的的占比(前5%灰度直方图面积占总面积的比例,较低代表颜色分布过于均匀)
  2. Transitioning frames
    用99年那篇文章的结果来进行过渡帧的检测 A feature-based algorithm for detecting and classifying production effects

以上两种筛选算法耗时较少,5min的视频仅需0.9s,平均将1118个视频长度缩减至88.64%。

2.Keyframe Extraction

视频中的每个镜头都有很多的相似帧,将它们组织起来最常用的方式为聚类,在本文中通过图片的美学指标(特别是静止度stillness)来进行聚类。聚类的数量n为视频的镜头数,每一类的中心帧即为封面。

  1. 特征挖掘:使用颜色、边缘直方图作为图片的特征,共2220维(不用SIFT是为了加速)
  2. 子镜头识别:聚类后的每一类即为一个子镜头
  3. 静止度矩阵(stillness metric):帧间差异度平方的倒数
  4. 关键帧提取:在每一类中找到静止度最大的那一帧

到此为止我们得到了每一子镜头的关键帧,下面从这些关键帧中找出最能代表视频的一帧。

3.Thumbnail Selection

通过相关度(relevance)和吸引度(attractiveness)来筛选关键帧。

  1. 相关度:对第2步得到的Keyframe再进行聚类,聚类的数量n从5-10取,使用gap statistic method得到最优的n,得到聚类后的集合\Omega,目的是进一步合并相似的关键帧
  2. 吸引度:衡量图像的视觉吸引度
    1)unsupervised方法,对集合\Omega中的每一个类,计算静止度最大的一帧作为该类的封面候选
    2)supervised方法,抽取了一些图像的一些特征,建了一个随机森林回归模型来计算aesthetic score

System Result

不同方法的top-5准确率
不同类型视频的准确率
  • 可以看到unsupervised方法是最优的

Qualitative Analysis

讨论了那些画面的参数影响了封面选择

  1. 视觉特征:我们考虑了53个视觉特征,包括颜色、纹理、质量、位置、运动能量等
  2. 数据准备:考虑到不同类型的视频封面的筛选标准不同,需要对所有的参数做归一化。方法为每个特征的数值为统计值而非真实数值,如封面的sharpness超过了视频的所有帧的90%,则sharpness值取0.9 「通过SIFT特征点,删去了和封面过于类似的帧」

在1118个视频中计算了每个特征的均值和方差得到下图:

均值和方差
Conclusion:
  • 人工选择的封面主要关注Objective Quality metrix,包括sharpness、brightness、contrast和colorfulness。解释了为什么unsupervised方法是最优的,而美学的指标并没有那么适用。
  • 颜色:封面帧往往有丰富的颜色,即没有dominant color,Hue Contrast会相对较高,同时亮度也要在一定的阈值以上。
  • 纹理:封面帧往往有更丰富的纹理,往往意味着画面中有更丰富的信息,这和图像美学的评价标准是相反的。
  • 基本质量:封面帧往往有着更高的基本质量,包括Contrast BalanceExposure Balance
  • 构成:封面帧往往没有一个主要的显著主体,而是在各个位置都有显著的Object。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,277评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,689评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,624评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,356评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,402评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,292评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,135评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,992评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,429评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,636评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,785评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,492评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,092评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,723评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,858评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,891评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,713评论 2 354

推荐阅读更多精彩内容