高斯分布

高斯分布计算方差和期望过程推导

有偏和无偏证明

高维高斯分布过程

高斯分布:
连续变量一种最重要的概率分布:正态分布

对于一元实值变量,高斯分布被定义为:

其中参数:\mu被叫做均值,\sigma^2被叫做方差,方差的平方根,由\sigma给定,叫作标准差,方差的倒数\beta = \frac{1}{\sigma^2},叫作精度。


根据上式,我们可以得到:



并且很容易证明高斯分布式高度归一化的,因此:


因此式(1.46)满足合理地概率密度函数的两个要求。

我们已经能够找到关于x的函数在高斯分布下的期望,特别地,x的平均值为:



由于参数表示在分布下的的平均值,它通常被叫做均值,类似的,二阶距:

x的方差被定义为:

分布的最大值被叫做众数,对于高斯分布,众数与均值恰好相等。

对于D维向量x的高斯分布:


其中维向量被称为均值,的矩阵,被称为协方差,表示的行列式。
假设有一批数据服从独立同分布,我们知道对于两个独立事件的联合概率可以由事件的边缘概率的乘积得到,由于数据是服从独立同分布的,因此对于给定的和,可以得到数据集的概率为:


上式就是高斯分布的似然函数。
使用一个观测数据集来决定概率分布的参数的一个通用规则是寻找使似然函数取得最大值的参数值。简化后续数学分析和有助于数值计算,写作对数形式:


关于\mu,最大化函数可以求得最大似然解:

这是样本均值,及观测到的{X_n}的均值。关于\sigma^2最大化函数,我们求得方差的最大似然解:

这是关于样本均值\mu_{MLE}的样本方差,注意我们要同时关于\mu\sigma^2来最大化函数,但是在高斯分布的情况下,\mu的解和\sigma^2无关,因此我们可以先对\mu求解,然后再对\sigma^2求解。

最大似然估计的平均值会得到正确的均值,但是将会低估方差,因子为\frac{N-1}{N},下图可以解释:



下面的对于方差参数的估计是无偏的:



©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 没有天燃气灶,也不能用柴火,我便寻了煤油炉子,煤油有限,不舍得用了来煮饭,那就煮面,每天尽可能变着花样给面里放不同...
    丹菡阅读 3,863评论 7 16
  • 事,不过“三”耳 在我微信朋友圈的签名档,我写的是那句(自以为得意的)原创的“座右铭”,即—— 论事[技][术][...
    鬼谷孫子阅读 4,121评论 0 0
  • 轩哥今年读大班了,开始正儿八经的背书包、写作业、学知识了。妞妹也一天天长大,开始跟爸爸互动玩耍。每晚晚餐后爸爸哄着...
    秦land阅读 3,916评论 0 1
  • 有些你认为过不去的事,终究还是会过去;有些你认为忘不了的人,时间会让他沉寂。或许有些难熬的时光、难过的事情会让你更...
    默茗棋妙阅读 1,254评论 0 1
  • 1.java/android DES加密解密 base64编码用的jdk1.8 2.iOS DES加密解密
    pretty_rain阅读 5,022评论 1 1