统计学基础一

均值

将所有的数加起来,然后除以数字的个数,这个就是均值,也是我们在计算平均值时最常用的方法。

在计算均值时,我们需要将所有的数字进行相加,通常是这样:

sum

而为了简化,我们通常用符号∑来表示相加(读作西格玛),上边的相加数学式可以如下表达

西格玛

均值是最常用的一个平均值,它有一个专门的符号来表示µ(读作缪),所以上述均值表达式如下:

均值

但是有时候我们会发现如果一组数字中有一个特别大的值或者特别小的值,会极大的影响最后的均值,使得数据可能无法真实的反映平均的状况,比如,把马云的财富和一些工薪阶层的财富作均值平均,会发现他们的平均财富非常大,但实际情况是只有马云一个人的财富非常大。在这里,马云的财富值就是一个异常值,而对于这种情况我们有个专有名词叫数据偏斜。

中位数

当数据发生倾斜时,我们往往还要看另外一个数值,叫“中位数”,顾名思义就是处在中间位置的数。比如:我们找了9个人,他们的财富值按从小到大的升序分别是:2万,3万,3万,4万,5万,6万,20万,30万,2亿。这个时候处于中间的是第五个数值:5万,那么5万就是这组数字的中位数。
当有10个人进行统计时,中位数就要计算第5个和第6个数值的均值作为中位数。

众数

有时候均值和中位数都无法反应实际情况,尤其是数据的分布是两边极大值,极小值偏多,中间值偏少时就会出现偏差,这种情况下我们就需要众数。
比如下边的一组数据:

财富值 (万) 频数
3 2
6 10
20 30
300 3
1000 1

这组数据中有20万财富的人数最多有30个,所以这组数据的众数就是20万,也就是说频次最多的数就是众数。

方差和标准差

有时候我们希望度量各个数值相对于均值的距离是怎样的,也就是衡量数值相对于均值是很分散,还是相对集中,这个时候我们怎么计算呢?最初的想法可能是这样的,使用如下方式计算平均距离

平均距离

我们看一个实际的例子,假设一个公司上半年的销售额如下表所示:

月份 销售额(万)
1 20
2 30
3 30
4 50
5 50
6 60

上半年销售额的均值很容易计算是40万,那么我们计算下平均距离

计算平均距离

可以看出这里有一个问题,就是这样求和之后总是为0,因为有大于均值的数值减去均值得正,而小于均值的数值则为负,最后相加为0,因此这样无法反应平均距离。此时我们的方差出场了。
为了不出现负值,我们让这个距离值都平方后再相加,如下:

方差

具体到我们的例子,计算如下:

[(20-40)²+(30-40)²+(30-40)²+(50-40)²+(50-40)²+(60-40)²]/6 = 200

方差毕竟是平方后的结果,在反映平均距离的时候不够直观,因此我们通常再取其平方根,这样就得到了标准差(也叫均方差),使用符号小写的西格玛表示,如下:

标准差
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,837评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,551评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,417评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,448评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,524评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,554评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,569评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,316评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,766评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,077评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,240评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,912评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,560评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,176评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,425评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,114评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,114评论 2 352

推荐阅读更多精彩内容