微信公众号:折耳根说
人民卫生出版社《卫生统计学》第6版第六章第二节 t分布中写道:
英国统计学家W. S. Gosset于1908年以笔名“Student”发表论文,证明t分布服从自由度v=n-1的t分布,即
t分布,又称Student t分布(Student‘s t distribution),记作t ~ t(v)。t分布十分有用,它是总体均数的区间估计和假设检验的理论基础。
为什么t检验称为Student~t检验,t分布称为Student~t分布?而不像其它的统计方法以科学家名字命名,如Fisher精确检验、Pearson相关等?
William Sealy Gosset(1876.6.13-1937.10.16)
后被称为英国统计学家
1912年的Karl Pearson
Gosset先在牛津大学学习化学和数学
1899年毕业后
在爱尔兰都柏林Arthur Guinness 啤酒厂
任酿酒化学技师
从事试验和数据分析工作
在已知总体均值和标准差时
样本均值的分布将随着样本容量n增大
越来越接近正态分布
但是
Gosset试验中的样本量都不大
一般只有5个
Gosset对每个样本分别计算X,S,t,即
获得大量t观察值
发现
t在(-1,1),(-2,2),(-3,3)内的频率
0.626,0.884,0.960
与N(0,1)在相应区间上的概率
0.683,0.995,0.997
相差较大
于是
他怀疑
是否还存在一个不属于正态分布族的其它分布呢?
为了研究这个问题
Gosset在1906-1907年去伦敦大学学习统计
与著名统计学家Karl Pearson(1857-1936,老Pearson)
1912年的Karl Pearson
1912年的Karl Pearson
和他的儿子Egon Sharpe Pearson(1895-1980,小Pearson)
共同讨论
Egon Sharpe Pearson
终于得到新的密度函数曲线
Gosset于1908年(32岁)以“Student”笔名发表此研究结果
在当时正态分布作为“万能分布”的时代里
代表统计学最高的水平的K. Pearson
只研究大样本问题
他认为
小样本是与统计精神相违背的
是危险倾向
在这种情况下
t分布并没有被外界理解和接收
只在Gosset工作的酿酒公司使用
直到1923年
Gosset以笔名“Student”发表t分布15年后
另一位著名统计学家Fisher(1890-1962)
Ronald Aylmer Fisher
在农业实验中
也遇到小样本问题
发现t分布的实用价值
并给出严格但简单的推导
1925年
Fisher又编制了t分布表
现在广泛应用的t分布表
至此
Gosset的小样本方法才被学术界承认
并迅速传播、发展和应用
Gosset~t分布打开了人们新思路
开创了小样本研究方法
在历史上具有划时代意义
但由于Gosset当时以Student发表
所以人们习惯称为Student~t分布
而非Gosset~t分布
1935年
Gosset59岁
离开了都柏林
到伦敦皇家公园旁的一家Guinness啤酒厂
担任总监
负责啤酒产量的科学研究
然而仅仅两年后
年仅61岁的Gosset
因心脏病英年早逝
Guinness公司为Gosset制作的纪念章
由于当时理论不被接受及公司的各种限制,Gosset只能以笔名“Student”(学生)发表这一历史性的成就。直至15年后,Fisher的验证,t分布才被学术界承认并广泛应用。后来的配对t检验、两两比较t检验等都是在Gosset~t检验的基础上发展而来。然而Gosset并没有因此成为同时代著名的统计学家,教科书也是一笔带过。直至今天,大家熟知的仍是Student~t检验,奠定t分布基础的Gosset知名度远不如Pearson、Fisher。在历史长河中,Gosset仍闪闪发光。谨以此文
拨开历史的尘埃,
纪念做出巨大贡献的Goseet!
参考资料
1.方积乾,孙振球. 卫生统计学(第6版). 人民卫生出版社,89.
2.https://www.nature.com/articles/140838a0
3.https://en.wikipedia.org/wiki/William_Sealy_Gosset
4.茆诗松,王静龙 ,濮晓龙.高等数理统计(第二版).高等教育出版社.
5.陈希孺.概率论与数理统计.中国科学技术大学出版社.