每天的早报,都会有数据支撑的新闻咨询,我们如何知道这个数据是否存在“造假”呢(否有夸大的成分呢)?各大招聘网站公布的在职员工平均薪资对于自身是否有可比性呢?小孩子的学期成绩波动大吗·······
在现实生活中,数据无处不在,但我们如何能够通过数据,探索出其中的奥秘呢?
这时候,统计学思维便能帮我们扫除80%的障碍,剩下20%属于经验判断能力。
知识点一:描述统计分析
【平均值】是我们最常见的也是常用的统计方式之一,但最大的缺点是对异常数据不敏感,因此在计算过程中,我们尽量将极端(异常)数据处理,保证结果的公正性。计算方式为总数/个数。
【四分位数】亦称为【中位数】,指将数据集从小到大排序,处于中间的数为中位数。在数据集n排序后,计算中间位置时会有两种情况,①如果n为奇数,则中位数是位于中间的数值;②如果n为偶数,则中位数为中间两个数的平均值。
【标准差】用来描述数据集的波动大小(离散程度、变异性)
如,某公司的工作标准差越大,则加薪也多;一只股票的标准差越小,波动性越小,则其稳定性越高,风险越小。
【标准分】是指距离平均值多少个标准差,可用正态分布图展示。
知识点二:概率
概率是用数值表示某件事情发生的可能性,亦称为期望值。
在概率事件中,又有小数定律和大数定律。
小数定律:只通过小量的数据分析事件的概率,但由于数据量较少,事件的概率通常会出现极端的情况。
大数定律:如果统计数据足够大,那么事物出现的频率就能无限接近他的期望。
End. To be continue!
相关参考:
知乎live-统计概率思维:描述统计学