1 总体与样本的概念:
以研究中国男人的平均身高为例:则全部的中国男人为“总体”,把总体中每个个体的特征都统计出来显然不现实。那么通过某种方式采集1W个个体的数据,这1W个个体就是一个“样本”。
注意:每一个个体一般称为“元素”。但也有些地方把一个个体称为一个样本,而一个样本称为一个样本集。意思都是那些意思。
2 抽样方式
从总体中获得一个样本称为“抽样”,抽样有很多种。
2.1 简单随机抽样:分为有放回抽样和无放回抽样(又称重复抽样和不重复抽样)
2.2 分层抽样:又称分类抽样。按照某个维度把总体分成若干层,每一层单独抽取样本。如研究全国身高情况时,按照省份每个省份抽取若干个个体。
2.3 系统抽样:又称等距抽样,把各个元素按某种方式排列编个号,然后等距抽取
2.4 整群抽样:把整体分成若干个群,然后以群为单位进行抽样。
实际上简单随机抽样和分层抽样使用较多,后两种估计不怎么用。