高斯分布也称为正态分布。
假设x是一个实数随机变量,如果x的概率分布服从高斯分布,其中均值为μ,方差为,那么将它记作。(波浪号读作服从...分布 )。
高斯分布的概率密度函数看起来将是一个钟形的曲线,μ控制曲线的中心位置,σ控制这个钟形曲线的宽度。因此参数σ有时也称作标准差。这条钟形曲线决定了x取不同数值的概率密度分布。 x取相对中心位置对应的概率值相当大,而x取远处的概率将逐渐降低,直至消失。
一个概率分布曲线下的面积,即阴影区域的积分一定是1,这是概率分布的一个特性。
参数估计问题:参数估计问题就是给定数据集,希望能够估算出μ和σ平方的值。μ就是平均值参数, σ平方表示方差。
在机器学习领域,参数估计和其实区别很小,一般使用,只要你有一个还算大的训练集。