[数据分析] 也说说平均数

大凡说起数据分析,很多人就会想起平均数。为什么平均数如此深入人心?它的重要性又是什么呢?

从释义上讲,汉字的“平均”有按份儿均匀计算的含义。统计学上的平均数其实有好几种不同的方式(大家应该能记得什么叫“统计口径”吧),我们耳熟能详的通常是“算术平均数”。举个例子,如果有4个系统支持工程师,甲乙丙丁,每个人的每天的解决问题的数量如下表。

系统工程师 每天解决问题的数量
17
23
19
27

表1 系统工程师小分队每日解决问题的数量(分布)

根据上表,这个小小系统支持团队的平均每天每人的解决问题数量是:
(17+23+19+27)/(1+1+1+1)= 21.5(个)
因为每个工程师的表现不同,我们不能单纯拿出某个工程师来代表这个团队的表现。于是,平均数就是一个非常好的用来描述“团队”的指标。如果用统计术语来说,甲工程师的17个问题是“个体”的特征,21.5个问题则是“整体”的特征。平均数最直观的一个作用就是来对某个数据集的“整体情况”做一个表述。

上例中,每个工程师解答的问题是同质同权的,也就是说每个工程师在解决问题的过程中的“权重”是一样的,并不存在甲解决的问题价值更加大一点。但实际情况通常会更加复杂,假定问题因有难易不同,给客户带来的价值也不同。那么我们怎么评价这个团队的一般表现?因为这次不同问题的价值不同,也就是说“权重”不同了。在IT的世界里,按常规,我们一般把问题分成4个等级。为方便起见,价值就是1、2、3、4。

1 2 3 4 小计
1 1 3 12 17
4 7 5 7 23
11 0 0 8 19
20 2 4 1 27

表2 系统工程师小分队解决问题数量按不同价值(分布)

有了权重再来看看甲和丁的表现:
甲:1x1+1x2+3x3+12x4 = 60
丁:20x1+2x2+4x3+1x4 = 40
虽然,丁每天要多解10个问题,但是从价值上来说竟然还是甲要多出20分。凭直觉就能够猜出来甲是经验丰富的老工程师经常是被要求解决一些棘手的问题,而丁很可能是刚刚入行的新手,主要处理一些比较简单但多发的问题。

插播一句。这个就是通过数字(或者更精确地说,用统计)来理解现实世界的一个例子,以后还会常常提到。毕竟,不解决实际问题,思想和技术就没有什么意义了。

那么,在有权重下的平均数,就是加权平均数。沿用表2,加权平均数为:
乙:4x1+7x2+5x3+7x4 = 61
丙:11x1+0x2+0x3+8x4 = 43
(60+61+43+40)/(1+1+1+1)= 51(分)
注意哦,这里单位改成了“分”,因为算术平均数是同质平均,只要单纯计算即可,而加权平均是有权重的,有时候要通过“某种衡量”来表达“量化”。

通过这两个平均数,可以看到同一个小分队,如果从不同的角度去了解情况,会得出一些完全不同的结论。单纯看解决问题的算术平均数,那么甲就是个典型的拖后腿的家伙了。再细致一些,了解到了不同问题的本质不同时,甲作为有经验的工程师的价值就体现出来了。

插播第二句。现实中,理解事情本身很重要,正确的理解才能有效利用数字。当然,利用统计来检验某些说法的有效性也是很有意思的话题。

平均数作为一个统计指标,它更深层次的意义还体现在“回归”上。这个话题有点复杂需要逐渐展开。

光有平均数是不是可以?当然不行,不然大家怎么老觉得自己“被平均”了呢?下周我们来聊聊方差与标准差。

返回目录

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,546评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,224评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,911评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,737评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,753评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,598评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,338评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,249评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,696评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,888评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,013评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,731评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,348评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,929评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,048评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,203评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,960评论 2 355

推荐阅读更多精彩内容

  • 古代为官,上体天心 下抚民意 今为管理,上体公司 下抚员工 官与管 何其似
    左道凡阅读 227评论 0 1
  • 近期,我拜读了秋叶老师的《如何高效读懂一本书》,受益匪浅,今天主要将对我有启发的几点和大家分享。 一、为什么别人每...
    写作积累阅读 389评论 0 1