视频镜头分割

视频镜头切分的两种方法

输入：视频flv文件

输出：镜头分割的位置，单位帧

思路分析：

定义一种特征，要求它能反映两帧不同图片的差异，同时对物体位置和大小的变化不敏感（镜头的移动和变焦不敏感）。前后两帧图像间该特征差异大的可能是分割点

此外，也有一个镜头内差异很大的情况，比如爆炸镜头，或高速移动的镜头。所以需要在切分时考虑相近帧的情况。

直方图方法

1. 特征定义为颜色直方图

2. 每一帧图像对应一个直方图，那么视频就是一个按帧序排列的直方图队列。定义直方图间的差为对应bin做差的绝对值求和。以此计算这个队列的二阶差分队列。若某一点差分超过设置的阈值则在该点分割镜头。

1. 特征定义为矩不变量

引入一系列定义

图像矩： M(p,q) = $\sum_{x}$ $\sum_{y}$ ( x^p * y^q * f(x,y) ) ； f(x,y)为图像在y行x列的灰度值

图像质心坐标： ( M(0,1) / M(0,0) , M(1,0) / M(0.0) )

构造矩不变量：N(2, 0) + N(0, 2)

其中： N(p,q) = $\sum_{x}$ $\sum_{y}$ ((x-M(0,1))^p * (y-M(1,0)) ^q * f(x,y))

矩不变量还有其他形式，本文使用简单的二阶矩求和，可以理解成到质心的距离。

2. 同上对矩不变量序列求二阶差分。若某一点差分超过设置的阈值则在该点分割镜头。