生信小技术(双重高斯分布)

我写的这些东西并不代表我已经完全理解了,只是从别的地方看到的可能会用到的知识点mark一下,以后回想起来可能会用得到。

高斯分布就是正态分布

高斯分布在自然界非常常见,中心极限定理很好的说明了它,但事情往往不是那么纯粹,很多时候我们得到的结果里面会混入两个截然不同的样本数据集,它们虽然各自都是高斯分布,但是它们的均值和方差都不一样,如果拿到的是它们的混合数据,就不能简单的使用一个高斯拟合来处理它了。

可能存在的双重高斯分布

该文章介绍的一个R包可以做

The bimodal distribution was approximated by the ‘normalmixEM’ function in the ‘mixtools’ package of R.

需要用到mixtools包的normalmixEM函数
帮助文档代码如下

data(faithful)
attach(faithful)
set.seed(100)
system.time(out<-normalmixEM(waiting, arbvar = FALSE, epsilon = 1e-03))
out
hist(waiting)
plot(out,2)

可以看到,很简单一个函数,就可以把faithful这个数据框里面的waiting列的数据进行双重高斯分布拟合!

说到双重正态分布,可以运用到男女身高,em算法等等

这里贴上我的参考文章:https://cloud.tencent.com/developer/article/1508952

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容