第十一章 总体方差的统计推断

参考书目为安德森的《商务与经济统计》,以下为个人的学习总结,如果有错误欢迎指正。有需要本书pdf的,链接在本文末尾。(仅限个人学习使用,请勿牟利)

第十一章 总体方差的统计推断

11.1 一个总体方差的统计推断

样本方差:s^2=\frac{\sum(x_i-\bar x)^2}{n-1}
(n-1)s^2/\sigma^2的抽样分布:从正态的总体钟任意抽取容量为n的随机样本,则\frac{(n-1)s^2}{\sigma^2}的抽样分布服从自由度为n-1的\chi^2分布

image

11.1.1 区间估计

我们取95%的置信区间,利用excel的=CHISQ.INV()函数来计算自由度19当上下侧面积分别为0.025的\chi^2分布值为8.901和32.852,如上图所示。
由于\frac{(n-1)s^2}{\sigma^2}服从自由度为n-1的chi^2分布。所以:
\chi_{0.975}^2 \leq \frac{(n-1)s^2}{\sigma^2} \leq \chi_{0.025}^2 (这里的下标指的上侧面积)
转化后可得:
\frac{(n-1)s^2}{\chi_{0.025}^2} \leq \sigma^2 \leq \frac{(n-1)s^2}{\chi_{0.975}^2}
0.0014\leq \sigma^2 \leq 0.0053
0.092 \leq \sigma \leq 0.073

总体方差的区间估计:
\frac{(n-1)s^2}{\chi_{\alpha/2}^2}\leq \sigma^2 \leq \frac{(n-1)s^2}{\chi_{1-\alpha/2}^2} 这里的下标指的上侧面积
\chi^2的值基于的自由度为n-1,1-\alpha的置信系数

11.1.2 假设检验

假设检验的三种形式:


image

步骤:

  1. 利用总体方差假设值\sigma_0^2和样本方差s^2来计算检验统计量\chi^2=\frac{(n-1)s^2}{\sigma_0^2}(\chi^2的自由度为n-1)
  2. 再利用p-值法和临界值法来确定是否拒绝H_o

例子:汽车公司规定到站时间方差不超过4

  • 假设:H_0:\sigma^2 \leq 4 H_a:\sigma^2 >4
  • 显著水平\alpha=0.05
  • 抽取样本:已知n=24 s^2=4.9
  • 计算\chi^2=\frac{(n-1)s^2}{\sigma_0^2}=\frac{(24-1)4.9}{4}=28.18
  • 计算可得:\chi^2=28.18时的上侧面积为0.2091>0.05,所以不能拒绝H_0
    image

也可以用临界值法,通过excel计算得到\chi_{0.95}^2=35.1725那只要比这个值高,就可以拒绝H_0

双侧检验比如设计考试试题,要求分数的方差\sigma^2=100
假设:H_0:\sigma^2=100 H_a:\sigma^2 \neq 100
抽样n=30,显著水平\alpha=0.05,样本方差s^2=162
检验统计量\chi^2=\frac{(n-1)s^2}{\sigma_0^2}=\frac{(30-1)\times 162}{100}=46.98
此时的上侧面积为0.0187,p-值=2\times 0.0187=0.0374<0.05我们拒绝H_0认为方差不为100

总结:


image

11.2 两个总体方差的统计推断

\sigma_1^2=\sigma_2^2时,\frac{s_1^2}{s_2^2}的抽样分布服从分子自由度为n_1-1和分母自由度为n_2-1的F分布
F分布的特点,不对称,F不为负,excel上对应的函数F.DIST()和F.INV()

image

举例:必将两个工序生产出来的产品质量的方差,n_1=n_2=21,那么上侧面积为0.05的F值F_{0.05}=2.12 (这里的下标是上侧面积)
我们假设:H_0:\sigma_1^2=\sigma_2^2 H_a:\sigma_1^2 \neq \sigma_2^2
当两个总体都服从正态分布时,样本方差纸币可以得到F检验统计量:
F=\frac{s_1^2}{s_2^2}
(为了查表方便计算,有excel可以随意)其中令样本方差较大的总体记为总体1,则F服从分子自由度df_1=n_1-1,分母自由度为df_2=n_2-1的F分布。

由于F中s_1^2较大,因此F总是分布在上侧,所以可以查表找上侧面积(有excel计算可以不考虑)

举例:学校从两个公司选校车,用送达时间的方差衡量服务稳定性。

  • 假设:H_0:\sigma_1^2=\sigma_2^2 H_a:\sigma_1^2 \neq \sigma_2^2
  • 显著水平\alpha=0.10
  • n_1=26 s_1^2=48
  • n_2=16 s_2^2=20
  • 计算得到F=\frac{s_1^2}{s_2^2}=\frac{48}{20}=2.40
  • 根据EXCEL计算得到对应的上侧面积为0.0406对应的双侧p-值为0.0812<0.10所以我们拒绝H_0认为方差不相等,选方差小的公司。

同样可以用临界值法:同样的分子和分母的自由度,在上侧面积为0.05的F值为2.2797,如果F>2.2797则拒绝H_0

单侧检验
假设:H_0:\sigma_1^2 \leq \sigma_2^2 H_a:\sigma_1^2 > \sigma_2^2

例子:民意调查,看男女对政治问题的态度上,女性方差是否比男性大。

  • n_1=41 n_2=31
  • \alpha=0.05
  • s_1^2=120 s_2^2=80
  • 计算得到:F=\frac{s_1^2}{s_2^2}=\frac{120}{80}=1.5
  • 根据EXCEL计算得到:F=1.5的上侧面积即p-值=0.1256>0.05,所以不能拒绝H_0,我们认为女性对政治问题态度的方差更大。

当然可以用临界值法:上侧面积为0.05的F值为1.57>1.5,所以也不能拒绝H_0

image

总结:F分布,必须要求两个总体至少近似正态分布才能使用。


链接: https://pan.baidu.com/s/1fc0q-Q4kj3g-7Fr4MHZaqw 提取码: 333c 复制这段内容后打开百度网盘手机App,操作更方便哦

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容