对于某些连续变量(比如周期变量),使用高斯分布建模并不合适。
为什么不合适?
考虑观测数据集的均值问题,首先假设为弧度,很明显平均值强烈依赖坐标系(原点)的选取。为了找一个均值不变的度量,我们将观测当做单位圆上的点,这样就可以被描述成一个二维的单元向量(取值区间在-1到1),求平均也就是
根据该均值找到对应的角度,这个定义将会保证均值的位置与极坐标原点的选择无关(???)。另外通常位于单位圆的内部。在笛卡尔坐标系下,因此样本均值的笛卡尔坐标,带入上面的均值公式可得:
使用公式可以求出,也就是观测数据集的均值。
现在我们考虑高斯分布对于周期变量的一个推广: von Mises 分布。
按照惯例我们考虑周期函数分布的周期为,满足下面三个条件:
我们可以很容易地得到一个类似高斯的分布,满足这三个性质:两个变量的高斯分布,均值为,协方差矩阵为,其中是个的单位矩阵。因此
概率为常数的轮廓线是圆形,如图所示。
该分布沿着一个固定半径的圆周的值。如果我们将这个分布的形式从笛卡尔坐标系转换到极坐标系,这样的分布具有周期性。
替换到高斯分布的公式里面,考察指数项(只有指数项与
定义
这被称为von Mises分布,或者环形正态分布( circular normal )。其中
对于大的m值,分布逼近高斯分布。
现在考虑von Mises 分布中参数和的最大似然估计,对数似然函数:
求
令关于的导数为0:
使用三角恒等式
我们有
这跟我们之前在二维笛卡尔空间的观测下求取的均值相同-
求
这里没看懂,直接贴图