对于某些连续变量(比如周期变量),使用高斯分布建模并不合适。
为什么不合适?

考虑观测数据集的均值问题,首先假设
为弧度,很明显平均值
强烈依赖坐标系(原点)的选取。为了找一个均值不变的度量,我们将观测当做单位圆上的点,这样就可以被描述成一个二维的单元向量
(取值区间在-1到1),求平均也就是
根据该均值找到对应的角度
,这个定义将会保证均值的位置与极坐标原点的选择无关(???)。另外
通常位于单位圆的内部。在笛卡尔坐标系下
,因此样本均值的笛卡尔坐标
,带入上面的均值公式可得:
使用公式可以求出
,也就是观测数据集
的均值。

现在我们考虑高斯分布对于周期变量的一个推广: von Mises 分布。
按照惯例我们考虑周期函数分布的周期为
,满足下面三个条件:
我们可以很容易地得到一个类似高斯的分布,满足这三个性质:两个变量的高斯分布,均值为
,协方差矩阵为
,其中
是个
的单位矩阵。因此
概率为常数的轮廓线是圆形,如图所示。

该分布沿着一个固定半径的圆周的值。如果我们将这个分布的形式从笛卡尔坐标系转换到极坐标系,这样的分布具有周期性。
替换到高斯分布的公式里面,考察指数项(只有指数项与
定义
这被称为von Mises分布,或者环形正态分布( circular normal )。其中
对于大的m值,分布逼近高斯分布。

现在考虑von Mises 分布中参数和
的最大似然估计,对数似然函数:
求
令关于的导数为0:
使用三角恒等式
我们有
这跟我们之前在二维笛卡尔空间的观测下求取的均值相同
-
求
这里没看懂,直接贴图

