我写的这些东西并不代表我已经完全理解了,只是从别的地方看到的可能会用到的知识点mark一下,以后回想起来可能会用得到。
高斯分布就是正态分布
高斯分布在自然界非常常见,中心极限定理很好的说明了它,但事情往往不是那么纯粹,很多时候我们得到的结果里面会混入两个截然不同的样本数据集,它们虽然各自都是高斯分布,但是它们的均值和方差都不一样,如果拿到的是它们的混合数据,就不能简单的使用一个高斯拟合来处理它了。
可能存在的双重高斯分布
该文章介绍的一个R包可以做
The bimodal distribution was approximated by the ‘normalmixEM’ function in the ‘mixtools’ package of R.
需要用到mixtools包的normalmixEM函数
帮助文档代码如下
data(faithful)
attach(faithful)
set.seed(100)
system.time(out<-normalmixEM(waiting, arbvar = FALSE, epsilon = 1e-03))
out
hist(waiting)
plot(out,2)
可以看到,很简单一个函数,就可以把faithful这个数据框里面的waiting列的数据进行双重高斯分布拟合!
说到双重正态分布,可以运用到男女身高,em算法等等
这里贴上我的参考文章:https://cloud.tencent.com/developer/article/1508952