原本打算学一学spss,但是看到一堆专业术语,一脸懵。于是又买一本老外的统计学入门书——《白话统计学》,发现老外写的东西还是比大学的《教育统计学》可读性更强,对统计学也多了一些浅显的认识。
一、什么统计学
按一般解释,统计学是关于认识客观现象总体数量特征和数量关系的科学。这里有几个关键词“总体”、“数量特征”、“数量关系”。这个“总体”的范围可以根据统计的目的界定。比如一个学校要分析本校今年毕业生的中考成绩状况。这时候“总体”就是该校今年全体的毕业生。如果要统计安徽省2018届中考成绩,这时候“总体”就是安徽省2018届全体毕业生。当“总体”范围越来越大,就给统计带来了极大的困难。为解决这一矛盾,就需要抽样,通过“样本”来推断“总体"的特征。但是这种推断可靠吗?这时候就要检验统计显著性、效应量和置信区间。所以概括起来,统计运算主要包括两方面:一个是用数据描述样本的数量特征和数量关系;二是检验从样本获得的信息能否代表总体的特征。
二、数量特征分析
最常见的数量特征分析关注中心趋势和离散程度。中心趋势在中小学成绩分析中比较常见。它主要包括:
均值就是所有取值的算术平均数。
中位数是分布中排在第50百分位处的取值。
众数是出现次数最多的取值。
如果一个分布的取值服从正态分布,那么它的均值、中位数和众数都会在同一点——分布的中心。然而样本的取值经常不服从正态分布,这时候就出现偏态分布。如果尾部趋向低端,则称为负偏,如果尾部趋向高端,则称为正偏。
考察离散程度有三个指标:极差、方差、标准差。
极差是一个分布中最大值与最小值之差。
方差是一个分布中取值离散程度的统计平均数。计算方法是把每一个取值减去平均值得到离差值取平方,然后把这些离差平方项全部加起来,再除以分布中的取值的个数。
标准差是一个分布中单个取值与均值之间的典型或平均离差。计算方法是把方差开平方。
极差提供的信息有限,方差因为数学运算性质也往往只作为其他统计的一个步骤,使用最多的是标准差。标准差越小,说明分布离平均数越集中,标准差越大,说明分布离平均数越分散。如果两个班级均分都是90,A班标准差是6,B班标准差是10,说明A班成绩在90分附近的人数比B班更集中。
同时箱线图也是考察分布的好方法,可以在以后的成绩分析中使用。
观察上面的箱线图,上下边缘代表最大值和最小值。箱体中间的实线代表取值分布的中位数,箱体顶端线代表了分布的第75百分位数,底端线代表第25百分位。从这一幅图基本能判断取值的分布情况。
三、数据相关分析
研究者经常对两个或两个以上变量的关系感兴趣,这就要测量变量间的相关系数。[待续]