第7章 抽样和抽样分布
从中抽取样本的总体叫做抽样总体(sampled population)。抽样框(frame)是用于抽选样本的个体清单。
7.1 EAI的抽样问题
总体的数值特征称为参数。考虑如何从2500个管理人员取得一个30名管理人员的样本入手。
7.2 抽样
7.2.1 从有限总体的抽样
统计学家建议采用概率抽样,因为基于概率抽样的样本可以对总体进行有效的统计推断。
7.2.2 从无限总体的抽样
总体容量无限大或者总体中的个体是由一个正在运行的过程产生的。统计学建议抽取一个所谓的随机样本。
7.3 点估计
计算样本均值、样本标准差、样本比率的过程称为点估计。
样本均值、样本标准差、样本比率的数值称为点估计值。
良好的判断是合理应用统计方法的基础。
7.4 抽样分布简介
当点估计量的期望值等于总体参数时,我们称这个点估计量是无偏的。
7.7 点估计的性质
1、无偏性
2、有效性 称有较小标准误差的点估计量比其他点估计量更相对有效。
3、一致性 样本容量越大,标准差越小,大样本容量下所给出的点估计与总体均值更接近。
7.8 其他抽样方法
1、分层随机抽样 由抽样设计者自行进行层的划分,例如按照部门、位置、年龄、产业类型进行划分。分层以后,从每一层抽一个简单随机样本。分层随机抽样的值依赖于层内个体的同质性。如果层内的个体是同质的,该层有较低的方差,那么在相对小的样本容量下便可获得层特征的一个好的估计。如果各层是同质的,那么分层随机抽样方法能在较小的样本容量下得到与简单随机抽样同样精确的结果。
2、整群抽样 以群为单位抽取一个简单随机样本,抽出的群的所有个体组成一个样本。当群中的个体不同质时,整群抽样得到的结果最佳。
整群抽样的基本应用之一就是区域抽样,其中群为截取或以其他方式定义的区域。所需样本容量要大。
3、系统抽样 容量很大的总体时,简单随机抽样的另一种替代方法称为系统抽样。如5000个取出50个样本,每100个个体选出一个为样本点。
4、方便抽样 以上讨论的抽样方式属于概率抽样技术,对基于样本结果推断总体时所产生的误差,可利用抽样分布做出概率解释。
方便抽样是一种非概率抽样技术,样本的确定主要是基于简便。样本中所包括的个体不是事先确定或按照已知概率选取的。
方便抽样的优点在于,样本选择和搜集数据相对容易,但从其对总体的代表性来讲,它不能用于估计样本的“拟合性”。
5、判断抽样 另一种非概率抽样技术。由对研究总体非常了解的人主观确定选择总体中他认为最具代表性的个体组成样本。抽样结果的质量依赖于选择样本的人的判断。
对概率抽样方法,有公式可用于评判抽样结果与总体特征的接近程度--“拟合度”。对于由非概率抽样方法得到的结果,在解释上要特别小心。