天真的英达先生:如何利用统计学看懂财务欺诈

日前,著名导演英达因为非法的“现金拆分行为”而惹上官非。作为美国绿卡持有者,在2011年4月到2012年3月之间的11个月之内,他先后把46.4万美元存入他和他妻子在四家银行的六个银行账户中。为了绕过监控,他每次存钱额度都低于1万元,前后分50次存入。

根据美国法律,超过一万美金的存款就要填写“现金交易报告”,结合英达案来看,每次的转账貌似都没有构成违法,但是这种行为是有意为之。这种刻意的分立账户、分期分批打入钱财等情况,也自然不在法律允许的范围之内。

对此,我的第一感觉是,英达先生一定没有读过统计学。他大概不知道,这种刻意的数据伪造,在今日的大数据运行效率之下,非常容易被计算机识别出来。

在《剪刀石头布:如何成为超级预测者》这本书中,就介绍了不少数据伪造的案例,以及如何被识破的故事。除了人性中的心理影响以外,这些案例的破解,也和统计学中的概率有关。


 

我们先说一个简单的:某个数学教授多年以来,一直在课堂上进行随机性实验。他让同学们分为两组,一组连抛硬币200次,并记录结果,另一组直接编造数据。

然后,教授只需要扫一眼作业,就能几乎完全正确的判断出哪些是伪造的数据。

你知道关键在哪里吗?抛掷200次硬币的真正随机数据,几乎肯定会出现6个连续的人头或字,但几乎没有人在编造随机序列的时候,敢真的这么做。

还有一个案例,某个餐馆的老板做了假账,编篡了每个星期的营业额。而某位会计学学生正好在此打工。账簿在内行人眼里,错的非常明显:n多数据末尾中没有一个以00为结尾,因为伪造数据者往往认为整数不够随机。

而在真正世界中,从00到99,每组两位数的出现概率约为1%。

看,如果你不懂得统计学的概率,你肯定编不出来正常的数据,你会犯的错误包括,但不限于以下几方面:

多次运用了个人偏爱的数字(每个人都有偏爱的数字);

有意识的避免整齐的数字,或者连续的数字,以为它们“不够随机”;

如果数据有上限,比如报销金额是500,你可能会多次采用478,485这类数字......

当人们在数据上造假时,他必须捏造一系列看似正常,没有可疑之处的随机数字。而我们认为的“没有可疑”,事实上可能是大大的可疑。

如果真要对付机器,我胡乱想了两个办法:

1.与其你一个人,你需要小伙伴的加入。由于每个人无意识偏爱的数字不同,本应异常明显的伪造者的爱好被平均了。

2. 与其你一个人苦思冥想的写啊写,不如利用计算机生成的随机数字吧。但是采用计算机生成的随机数字,并不一定能达到你的目的。

即使如此,因为计算机同时进行多种算法检测,愚弄计算机还是非常的困难......所以,我们打消这些小念头吧。


Naive呀,英达先生。46.4万分50次存入,每次上限少于1万元,说明这些钱几乎都是以9千多元的金额存入的。连着50次存入9000多元,这不是有点奇怪么?大多数人存钱,就算不是从1到9分布排列,但也不会连着50次都在9000多元吧。在大数据运算和监测如此快速的今天,这笔账被翻出来并不奇怪。

事实上,书中有一个章节,就记述了本福特定理在美国国税和执法部门的运用。

1920年代,物理学家本福特在纽约州一家通用电气公司效力,他发现,很多数据在首位数的分布并不平均,其中以1为最多。因为自然规律,这种分布适用于各类型的数据,但不适用于电话号码、邮编等人为规定平均分布的数值。

之后,本福特定律被一个叫尼格里尼的学者在90年代发扬光大,其分析方法被执法机构、税务机构和私营部门广泛采纳。审计人员可以利用这一点来判断数据是真实可信的还是伪造出来的。


图片发自简书App


早在1998年,纽约时报就曾报道,包括加利福尼亚州在内,美国好几个州的税务机构都使用以本福特定律为基础的检测软件。因此,利用计算机检测数据由来已久,只不过外行人没想到或者不理解而已。

当然,也有很多正当理由使得首位数与本福特定律不符。不过还有次位数定理,此时检验前两位数便有作用,这会生成有100个矩形的直方图。这样不符合的几率就会大大的降低。

在当今,白领犯罪的主要手段就是虚构数字,做假账,例如在销售数据上篡改数字,在申报单上做手脚。当人们捏造数字时,数字会出现可预测的模式,能够辨识出这些模式的人就能迅速核查财务数据的可信度。

因此,英达先生事件并非偶然,而是一种必然。他心存侥幸心理,只不过是没有学过统计学,没有意识到数据的规律如此强大而已。

书中后面还讨论安然的虚假年报,麦道夫捏造的收益率从数据上看是多么的不正常,例如,安然公司在2001年到2002年所公布的每股盈利数字就不符合本福特定律,这证明了安然的高层领导确实改动过这些数据。也多少教会你识破年报和公司财务数据中的伪造,在今日的A股市场大概也会很有用吧。

有一本统计学书的封面上写着:“懂得统计学的人,运气都不会太差。”——确实如此。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,490评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,581评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,830评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,957评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,974评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,754评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,464评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,357评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,847评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,995评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,137评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,819评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,482评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,023评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,149评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,409评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,086评论 2 355

推荐阅读更多精彩内容