个人对于“数字”的局限性的理解

2018年5月31日 Lee公子 文 于杭州
自己的工作内容与数字的交集算是比较多——在商业项目中,往往需要大量的数字证明来提供给各类人士决策(上级领导、集团管理层、外部投资人、政府部门等),结合长期量化分析的工作体会,谈谈自己对“数字”和“量化”的局限性理解。

第一,任何数字拿出来说事儿,必须要有充分的前提假设,不说前提,只说数字结论的,除非是沟通双方早已经明确了前提假设条件,否则统统是胡说八道。
第二,任何数字的意义,都来源于比较,因此一定有一个潜在的比较标准物或者标准值,不说这个比较值的,统统没有意义。而这个比较值的选择,却绝不是客观的和唯一的,出于各种目的或者立场,可以主观选择各种值作为比较值,完全可以让数字的意义变得千差万别,公说公有理,婆说婆有理。
第三,任何数字,都有其测定数据的时空范围——超过测定数据空间范围和时间范围的东西,数字就没有意义了。不说清楚数字背后涵盖的时间周期和空间范围,数字就是胡说八道。
第四,数字的意义存在于变化和比较中,没有变化,静态的数字其实根本没有什么用。
第五,数字测量一定要有算法,而算法实际上是非常主观的东西。

算法这种东西,完全取决于计算者的立场,要给什么人看,以及要达到的目的,其实相当主观,而且是越复杂的算法越主观,我甚至还有一个体会,越是高段位的专业人士,其算法越主观,越是体现其个人意志。
加减乘除是最简单直接的算法,也是相对来说最客观的算法,但是对于一个大项目的财务模型或者投资模型,就需要一套非常复杂的算法,这个算法中,要向阅读者表达和突出哪些数字,要给内部人看还是给外部人看,要让这个项目成立还是不成立,都是计算者可以有足够余地“操之在我”的事情。
由于“设计算法”属于有较高专业门槛的工作,一般人能够接触到复杂算法的机会不多,未必能够真正理解我说的“算法的主观性”。我没有进入过编程或者物理等领域,仅仅是从商业领域来理解,“算法的主观性”绝对是“客观”存在的。

第六,数字的测量需要依靠各种仪器、设备、技术手段来获取,而这些东西的精准度和测量方法却不见得客观。

举几个例子:

  • 我给家里父母买了智能测血压的手环,手环从来显示我父亲的血压都是正常的,但是我父亲根据其他血压计测量结果和自身感受,血压是偏高的;
  • 我买了激光测距仪,和传统的工程卷尺测出来的结果比较,还是有一定的差异,我并不清楚是我的激光测距仪不准,还是卷尺不准,还是测试时候方法产生的误差。
  • 两块手表,如果时间对不上,你就会完全搞不清楚所谓的“准确时间”到底是什么。
  • 我还听说这种段子,某北方高污染城市,为了不让PM2.5数值爆表,减少政府的舆论压力,安排在采集数据的几个区域的街道上,频繁洒水——市民看到的PM2.5数据怎么可能有客观性?
第七,数字的解读其实是非常主观的东西。

数字的解读完全看解读者的目的,除了更换标准参照物可以完全改变数字的意义之外,还可以用很多带有感情或者渲染色彩的形容词赋予数字某种意义。

第八,数字的呈现方式其实是需要精心设计的,包含了表达者的主观意图。

无论是在宣讲的PPT中还是宣传广告中,数字的呈现方式都是需要精心设计的,其中一定传递了表达者的意图。
例如,一组数据为了突出市场巨大,可能要用对比强烈的柱状图来表现,而不用饼图或者列表来表现;一个数据为了突出其特殊意义,让观众看到,可能会被特意加粗、变红、放大、居中……

第九,量化是一种对于被描述的客体的“降维”过程,客体的丰富属性在量化或者数字化的过程中被剥夺和极端简化,被量化的东西其实都是被降维简化的东西,并不真实。

要真正理解这一点不太容易,不过我可以举一个例子:一个梨和一个苹果其实无法直接相加或者相减,因为他们有“梨”和“苹果”这样的具体自然属性(或者个性)相互区别;但是如果把“梨”和“苹果”降维简化为“水果”,那么他们就可以相加变成两个“水果”,个性被消除了,你理解和记住他们变得容易了,但是这样的量化结果却离真实很远。
再比如,钱就是一些量化的数字,但是做投资的人,最重要的思维就是要还原这些量化数字背后的属性,必须把钱分出结构,分出属性,分出轻重缓急,分出好坏善恶,分出贵贱,分出长短期……你只有把抽象成一维的这些资金的数字,还原为具体的时空场景下的对应事物,你才能够真正理解资金,才能进一步掌握它。
只会看数字这种低维信息的人,理解力也会被“降维打击”。
区分投资高手和庸手之间的区别,关键就在于是否能够对数字进行正确的“升维还原”,看清真相,掌控现实,而不是唯“数字论”,用各种“率”各种“值”各种“百分比”来理解现实。
要提醒一点,越是复杂度高的领域,其被强行量化后得出的结论的可信度越低,因为在量化过程中被“降维”抽象掉的属性会越多——复杂的东西被量化后只是方便人理解和记忆,方便观点的传播,但是这种东西根本不是真相,甚至远离真相。例如,把一个国家的经济发展水平简化为GDP,把一个城市的房地产市场简化为房价指标,把国际经济趋势简化为看美元指数,把国际贸易兴衰简化为看一个波罗的海干散货指数等等,根本都不靠谱。

第十,数据统计不能做因果判断,只能提供相关性证明。

在医学和生物学领域,最为搞笑的科学统计便是日均食盐摄入量与高血压发病率的关系。"科学"的"统计数据"除了能揭示这两者间存在相关性,再不能说明任何实质问题。借助于统计学,我们确实可以将食盐摄入过多解释为高血压的致病原因。但是同样根据统计学,中医们也可以说因为某些西医们不懂的原因,比如"肾虚",人们会出于生理本能而在不知不觉当中加大了食盐的日常摄入,并且最终会因为"肾虚"而非盐分过多才导致血压增高。这种中西医基础观念的有趣博弈教育了我们:千万别迷信统计学的种种因果判断,统计学仅提供相关性的证明。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,084评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,623评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,450评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,322评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,370评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,274评论 1 300
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,126评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,980评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,414评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,599评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,773评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,470评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,080评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,713评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,852评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,865评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,689评论 2 354