一.简介
Kolmogorov-Smirnov是比较一个累计分布(cumulative distribution function)函数与经验分布函数(empirical distribution function)二者的观测值偏差K-S statistic(检验统计量)是否在一定范围方法;如在一定范围,则原函数属于某一特定的概率分布。
累计分布(cumulative distribution function):把所有的observation排序,得到,那么
,其中n为样本个数,i为每个样本的值。
经验分布(empirical distribution function):通过查表得到。
K-S statistic(检验统计量):
二.实例
单样本实例
我们有10个数据点:
108, 112, 117, 130, 111, 131, 113, 113, 105, 128。我们想知道,这些点是否来自平均值是120,标准差是10的正态分布?120,10大致为本组数据的平均值与标准差。
1.排序
105, 108,111,112, 113, 113, 117, 128, 130, 131
2.计算累计分布和经验分布(查表得到)的差值
差值的最大值是0.358。 从表格(见附录)中可以查出,在 α=0.10的时,critical value是0.37。因为0.358<0.37,所以这些点来自平均值是120,标准差是10的正态分布。
多样本实例
有以下两组样本:
X:1.2, 1.4, 1.9, 3.7, 4.4,4.8,9.7,17.3,21.1,28.4
Y:5.6,6.5,6.6,6.9,9.2,10.4,10.6,19.3
1.把两组样本合在一块。
2.进行排序。
3.计算计算累计分布和经验分布的差值。
这里
对于两样本,95%的critical value的计算公式为:
1.36也是查表得到的。
因为0.6<0.645,所以两组样本的分布一样。
参考:
https://zhuanlan.zhihu.com/p/292678346
https://zhuanlan.zhihu.com/p/146781665