一听:关公战秦琼

我们学习了个体和群体比较的方法。我们说,在统计学中,只要找到可比性,理论上就没有不能比的。这就意味着,哪怕是两个不同的、看上去没有关联的东西,也能做比较。

日常生活中,比较两个不一样的东西还挺常见的。比如这几个场景:

第一个:老耿和他表哥一起参加高考,一个在河南省,考全国卷I,一个在黑龙江省,考全国卷II(*参考往年高考试卷规则)。老耿考了650分,表哥考了630分。两个人要比一比,谁考得更好?老耿说,我分数高;表哥说,我们省试卷难。这该怎么比?

第二个:篮球队老虎队和小龙队都打了半个赛季的比赛。老虎队10胜5负,净胜分60分,小龙队9胜6负,净胜分30分。问这半个赛季,哪支球队表现更好?老虎队说,我的胜场数更多,净胜分也更多;但小龙队表示,我前半个赛季赛程艰苦,多次遇到强队,而你们老虎队净遇到弱队了。这又该怎么比?

第三个:小明刚出生的时候,父母年收入1万元。18年后,小明上大学,父母年收入10万元,家庭年收入是18年前的10倍。可是妈妈却说,收入涨得快,但猪肉涨得更快,现在生活水平还不如18年前。小明妈妈这么比,准确不准确?

这三个例子,看出来共同点了吗?其实,这些比较都是我们平时说的“关公战秦琼”的问题。两个不一样的东西,怎么比呢?

其实,如果用统计学的视角分析,“关公战秦琼”的问题就是把不同条件下的对象放在一起比较。想要完成这样的比较,除了选择合适的比较维度之外,还要确定合适的基准。只有在一个合适的基准下,比较的结果才有意义。

前面的内容里,我们已经说了如何选择比较维度,这一讲,我们说说怎么选择比较基准。

问题不同,基准不同

说到选择基准,我们首先得明确一点,就是,问题不同,基准也不同。

如果问题是“谁的语文试卷分数更高”,那考试分数就是这个问题的比较基准。反过来,分数这个比较基准,只能回答“得分高低”的问题,而不能回答“谁考得更好”这个问题。

同样地,如果问题是谁在联赛上的积分更高,那比赛胜负数就是这个问题的基准。但胜负数这个基准,并不能回答“开赛以来哪只球队表现更好”这个问题。

再就是,如果问题是18年后,小明父母的收入提高了多少,那基准可以是收入的绝对数量。但这个基准,并不能回答小明家的生活水平有没有变得更好这个问题。

换句话说,问题不同,基准也不同。如果要解决谁考得更好,哪支球队表现更好,生活水准有没有变好这些问题,我们就需要重新选择比较的基准。

选择基准要科学

问题简单的时候,基准似乎很容易确定,比如“关公战秦琼”。如果问题是两人谁的活动范围更大,那就很简单,直接去算两人的活动面积、或者统计两人各自去过的地方就好了。

但是,大部分“关公战秦琼”的问题,都是很复杂的。这时候,基准的确定就成了一个问题。简单来说,选择基准有三个不同的方法:第一,相对位置;第二,标准他者;第三,综合指标。咱们一个一个说。

首先是“相对位置”,就是将个体在总体中的相对位置,作为比较的基准。

比如,我们想比较关公和秦琼的战斗力,那就可以看看他们在各自朝代的相对位置。如果关公的战斗力在汉代排名前5,而秦琼在隋唐排名前13,那么就是关公更厉害。

其它问题,也是一样。老耿和表哥高考的目标是相同的,都是为了进大学,而进大学其实看的不是绝对分数,而是相对排名。那我们可以比较老耿和表哥在各自省里的排名,谁的排名高,谁就考得更好。

顺着这个思路,我们还可以把两人的绝对分数折算成标准分,用标准分来体现各自的排名。

标准分,也是标准的统计工具。有了标准分,就有了比较的基准。其实,生活中也有很多类似的标准分。比如判断两个单位里的人,谁职务更高?就常常说,谁是正处级,谁是副处级。科级、处级、厅级,这也是一种标准分。

说完了“相对位置”,我们再来看确定基准的第二个方法——标准他者,也就是寻找一个共同的参照物,作为比较的基准。

比如,关公要和秦琼比身高,那我们就可以找一个双方都能用上的参照物。比方说,关公进庙门的时候低了一下头,而秦琼没有。我们已知汉代的庙门高度和隋唐的庙门高度一样,那就说明关公比秦琼高。当然,这个例子不是真实的,没有史料支持,我这里是想说,选择一个标准他者,是获得基准的思路。

要说现实的案例,那也不少。

比如谷歌的PageRank算法,可以比较两个网页谁更有影响力。它是怎么比较的呢?简单地说,谷歌不是看哪个网页被引用了更多次,而是会考虑引用者的排名情况。谁被更有影响力的网站引用,谁就更有影响力。生活中,这种比较思路也经常被我们不自觉地使用。

两个人谁更有影响力,两本书哪一本可能更好?我们往往直观的偏向于,通过谁的朋友更有影响力、哪本书被专家推荐更多来判断。这都是选择他者来比较。

当然,在统计学中,这种思想的应用其实是需要定量化的,一般都需要运用复杂的算法去评估他者的价值,而不能是我们日常的、定性的感受。

最后一种确定基准的方法,就是看综合指标。

比如,关公、秦琼谁厉害?这种问题就不能只看武力,而是要比较各个方面的不同指标。我们可以设计一个战局,分别比较个人武力、胜仗次数,以及历史影响力,三场擂台,谁胜得多谁就更厉害。比如,个人武力上,关公排前五,秦琼排前十三,第一局关公胜。数胜仗次数,秦琼一生打了两百余阵,胜仗很多,而关公呢?虽然水淹七军威震华夏,但最终还是败走麦城,这一局秦琼胜。历史影响力呢?关公是武圣,又是财神,到今天还被供着,而秦琼,虽然是门神,但早就不贴门上了,第三局关公胜。连在一起看,关公三局两胜,关公赢了。

再比如,比较2021年奔驰和特斯拉谁更厉害,这可能就要比股价、比销量、比利润、比客户满意度。类似的还有大学排行榜、城市投资潜力、城市宜居程度等。所有这些比较,都不是单一指标,而是要设计一系列指标,然后合成一个综合指标,来做最终的判断。在很多领域,这个综合指标通常被称为“指数”。

相对位置、标准他者、综合指标,就是寻找基准的三个方向。总之,确定基准的核心是获得可比性。而到底用什么基准实现可比性,则需要领域知识、想法创意以及统计技能相结合。

就基准达成共识

现在我们确定了比较基准,是不是就万事大吉了呢?并不是。我们还要就基准达成共识。换句话说,看看选择的基准让不让人满意。

还是关公战秦琼。刚才,关公三局两胜赢了秦琼。可这时候,秦琼的粉丝不同意了,说明明打胜仗才最重要,历史影响力这件事,秦琼没有办法努力啊。所以现在的指标不行,应该给各个指标加权。比如,个人武力指标占30%,胜仗比例占70%,历史影响力最好是0。这样一算,秦琼胜出。而还有另一个人认为,武将厉不厉害这件事,既不能看武力值,也不看胜仗数,而是要看战略能力,看指挥能力,还要看与首长的关系。这样一来,刚才的综合指标就全废了。

这里的问题是什么?就是对选择的基准缺少共识,觉得现在的基准没法达成比较任务。

现实生活中,物价比较的基准最常见的是CPI。CPI常常被叫作“一篮子价格”,也就是将基础生活用品的价格,按照权重进行均衡的一种基准指数。这是政府的一种共识。但这种共识是不断调整的。根据生活的变化,不断调整CPI中包含的生活用品、不同生活用品的权重,以及各自的价格,以适应市场的变化。比如,过去听音乐,我们买黑胶唱片,后来买录音带或者CD机,现在可能购买的是音乐服务。这些是不断变化的。CPI要充分反映这样的变化,不断地更新基准,以符合当下的状况。其实,也就是符合更多数人的共识。

再比如,上证指数其实也是一种基准,可以用来反应股市的波动变化。这是股市监管者和股民的共识。而组成指数的权重股是一直不断变化的,权重本身也是不断变化的。换句话说,共识也是不断调整的。

所以,如果没有形成共识,就没法选择完美的基准。而即便过去有了共识、有了基准,现在也未必适用,共识和基准都是不断迭代和变化的。

小结

总结一下这一讲:

第一,对于关公战秦琼这样的问题,除了选择合适的比较维度之外,还要确定合适的基准。只有在一个合适的基准下,比较的结果才有意义。

第二,选择基准时,有三个不同的方法:相对位置、标准他者和综合指标。

第三,没有形成共识,就没法选择完美的基准。而且,共识和基准是不断迭代和变化的,过去的基准和共识,现在未必适用。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354

推荐阅读更多精彩内容

  • 美国亚利桑那州立大学新闻与大众传播学院教授朱丽叶∙华莱士(Julia Wallace)提出了一个有趣的问题:“特朗...
    杰罗姆阅读 303评论 0 3
  • 有一段传统相声叫《关公战秦琼》,说的是民国时期山东省主席韩复渠的老爹过生日,请来戏班子唱《千里走单骑》。 老爷子听...
    梁潇小院阅读 1,879评论 6 8
  • 想起一个话题,民间一直有崇尚文武英雄的尚武情节。尤以男孩儿,骑马打仗是童年最顶级的幻想。但近些年由于游戏文化...
    奇妙叠阅读 414评论 0 1
  • 甲:现在您到剧场看我,是艺术享受,是一种娱乐。 乙:是呀,文化生活嘛。 甲:您看剧场里多好,座位舒适,空气流通,设...
    罗掌柜real阅读 497评论 0 1
  • 说起关公战秦琼,大家都当相声里听到的笑话,可现实中却屡屡发生。举个例子,假如你听到一种东西里含有维生素C,B, E...
    张老三医馆阅读 194评论 0 0