Kolmogorov-Smirnov test (K-S 检验)

一.简介

Kolmogorov-Smirnov是比较一个累计分布(cumulative distribution function)函数f(x)与经验分布函数(empirical distribution function)g(x)二者的观测值偏差K-S statistic(检验统计量)是否在一定范围方法;如在一定范围,则原函数属于某一特定的概率分布。

累计分布(cumulative distribution function):把所有的observation排序,得到y_{1}、y_{2}、......y_{n},那么

F_{obs}(y_{i})=\frac{i}{n} ,其中n为样本个数,i为每个样本的值。

经验分布(empirical distribution function)F_{exp}(y_{i})通过查表得到。

K-S statistic(检验统计量):D_{n}=max(|F_{obs}(y)-F_{exp}(y)|)

二.实例

单样本实例

我们有10个数据点

108, 112, 117, 130, 111, 131, 113, 113, 105, 128。我们想知道,这些点是否来自平均值是120,标准差是10的正态分布?120,10大致为本组数据的平均值与标准差。

1.排序

105, 108,111,112, 113, 113, 117, 128, 130, 131

2.计算累计分布和经验分布F_{exp}(查表得到)的差值

差值D_{n}的最大值是0.358。 从表格(见附录)中可以查出,在 α=0.10的时,critical value是0.37。因为0.358<0.37,所以这些点来自平均值是120,标准差是10的正态分布。

多样本实例

有以下两组样本:

X:1.2, 1.4, 1.9, 3.7, 4.4,4.8,9.7,17.3,21.1,28.4

Y:5.6,6.5,6.6,6.9,9.2,10.4,10.6,19.3

1.把两组样本合在一块。

2.进行排序。

3.计算计算累计分布和经验分布的差值。

这里 D_{n}=0.6

对于两样本,95%的critical value的计算公式为:

1.36也是查表得到的。

因为0.6<0.645,所以两组样本的分布一样。

参考:

https://zhuanlan.zhihu.com/p/292678346

https://zhuanlan.zhihu.com/p/146781665

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容