————我的个人学习笔记和学习思路
上面提到,统计学是一门关于数据的科学,数据是核心
当我们拿到原始数据时,我们应该如何去整理和分析呢?
原始数据——整理成表(频数分布表)——而表不能更加直观反映数据分布概念,因此需要制图来描述
1.频数分布表:需要掌握制作步骤(简答)
2.频数分布图:直方图、直条图,饼图等,(掌握)会考察它们应用于各种数据类型
上面提到,为了更好的描述数据的分布形态,使用了图表,但图表对数据的描述较为笼统,因此我们需要更加定量的,具体的描述数据
1.描述数据的集中趋势:算数均数,几何均数,中位数,众数。
与均数相比,中位数存在哪些不足?(简答)
2.描述数据的变异程度:极差,四分位数间距,方差和标准差,变异系数
(需要掌握它们的基本概念,计算公式及适用条件)
3.箱式图:呈现了最大值,最小值,上下四分位数以及中位数等重要指标,它可以全面简洁的呈现数据的平均水平及变异程度等一系列指标
百分位数图及热图,考察较少,了解即可,但也有个别重点高校考察过如何绘制热图
4.收集到数据后,我们需要对数据进行核查,以发现问题数据,提高数据质量,因为再好的统计分析方法也无法拯救糟糕的数据
方法:(1)逻辑核查 (2)离群值的探索(此处可能考简答)