真正作为调查对象的集合 叫做 总体 Population
由总体中取出的部分个体所组成的集合 叫做 样本 Sample
确认数据种类
不可测量的数据 称为 分类数据
可测量的数据 称为 数值数据
掌握数据整体的状态 (数值数据篇)
数据分组
组中值 Class MidPoint
次数 Frequency
相对次数 Relative Frequency = 数据个数 / 数据总数
直方图 Histogram (柱状图)
次数分布表 Frequency Distribution Table
平均值 (算术平均数)Arithmetic Mean
中位数 Median 排序后 最中间的值
标准差 Standard deviation 表示平均离散程度的指标
关于总体标准差和样本标准差计算公式不一样,可以参考知乎的回答:
https://www.zhihu.com/question/20099757/answer/658048814
推理统计学 和 描述统计学
推理统计学 从样本的信息推测总体的状况
描述统计学 用统计学知识来描述事务的状况 比如班级的成绩如何,这里不再是推理 而是描述
掌握数据整体的状态 (分类数据篇)
次数分布表
标准计分和离差
标准计分 Standard score
标准计分的平均值为0 标准差为1
离差 deviation score
离差的 平均值为50 标准差为10
机率密度函数 Probability Density Function
以平均值为中心 左右对称
受到平均值和标准差的影响
在统计学上,以“x服从平均值为y,标准差为z的正态分布”来表示
将数据进行标准计分之后,结果服从标准正态分布
机率密度函数的图形和横轴围成的面积,与其比例和机率是相同的。
卡方分布
卡方分布 Chisquare Distribution
自由度 degree of freedom