参考书《白话统计学》
从总体中选择样本,又在样本中收集数据,使用样本的数据推断总体,但是样本数据到底有多大意义,样本统计量能在多大的程度上推广到更大的总体?
推断这种结论通常使用:
- 检验统计显著性
- 计算效应量
- 置信区间
统计量一般分成两类:描述统计量和推断统计量
推断统计量那个是根据一个样本或者样本组中收集的数据来对更大的总体进行推断
效应量是在不考虑样本容量的条件下对观测效应大小的一种测度。
置信区间 此类区间提供的取值范围被认为以一定的概率水瓶包括了实际的总体参数
统计显著性
统计显著性指样本统计量代表抽样总体中某种现象的可能性或者概率
概率
略
假设检验与第I类错误
在计算统计量并决定结果是否显著之前,要提出一种假设并确立一种准则用于决定保留或者拒绝假设,即零假设,意味着效应不存在,比如样本均值与总体均值无差异
替代假设
这里的替代假设并不包括猜测样本均值大于或是小于总体均值,只是这两者不同,这就是双尾替代假设
α水平或者第Ι类错误 :样本均值与总体均值之间要有多么不同才能被认为是差异而不是偶然。
比如总体均值是9,样本均值是9.00000001的情况
效应量
统计显著性有一些缺陷,其中之一就是对于样本容量过于敏感。
效应量 = 样本均值与总体均值的差然后除以标准差
以检测样本和总体均值是否有显著不同为例
置信区间
置信区间提供的是一个取值范围,在这个范围内以一定的概率水平包含了总体参数。