视频镜头切分的两种方法
输入:视频flv文件
输出:镜头分割的位置,单位 帧
思路分析:
定义一种特征,要求它能反映两帧不同图片的差异,同时对物体位置和大小的变化不敏感(镜头的移动和变焦不敏感)。前后两帧图像间该特征差异大的可能是分割点
此外,也有一个镜头内差异很大的情况,比如爆炸镜头,或高速移动的镜头。所以需要在切分时考虑相近帧的情况。
直方图方法
1. 特征定义为颜色直方图
2. 每一帧图像对应一个直方图,那么视频就是一个按帧序排列的直方图队列。定义直方图间的差为对应bin做差的绝对值求和。以此计算这个队列的二阶差分队列。若某一点差分超过设置的阈值则在该点分割镜头。
矩不变量方法
1. 特征定义为矩不变量
引入一系列定义
图像矩: M(p,q) =( x^p * y^q * f(x,y) ) ; f(x,y)为图像在y行x列的灰度值
图像质心坐标: ( M(0,1) / M(0,0) , M(1,0) / M(0.0) )
构造矩不变量:N(2, 0) + N(0, 2)
其中: N(p,q) = ((x-M(0,1))^p * (y-M(1,0)) ^q * f(x,y))
矩不变量还有其他形式,本文使用简单的二阶矩求和,可以理解成到质心的距离。
2. 同上对矩不变量序列求二阶差分。若某一点差分超过设置的阈值则在该点分割镜头。