为什么学数学?万维刚这篇文章(有删减)清楚的解释了期望值、标准差、正态分布、夏普比率,学好数学成就人生!
今天咱们说点概率论。你肯定听过“正态分布”和“标准差”这两个概念,但是很多人并不了解它们的意义。
我们的目的不是学数学,今天不会出现复杂的数学公式,我想给你一个直观的解释。有了标准差这个概念,你以后考虑问题的时候,就多了一个思维工具。你观察世界会有一个更精确的眼光。
在我看来,正态分布和标准差,是这个不确定的世界里数学家送给世人最有用的礼物。
这个思想可以用在很多事物上,但是为了简单起见,咱们还是用投资来打比方。
1.只有期望是不够的
假设现在你手里有一笔钱,想投资做个小生意。你的一个朋友找到你,说他知道一个好生意。他说咱们拿这些钱在国内采购一批药品,运到非洲去卖掉,只要两个月的时间,平均会有40%的利润。请问这个生意你做不做呢?
两个月赚40%,这在任何地方都是好生意 —— 但是在你做决定之前,肯定会问一个问题。
风险。
如果你今天给我10万元,我过两个月一定、确定、肯定还给你14万,这样的生意谁都会抢着做 —— 所以世界上根本就没有这样的生意。
你朋友介绍的这个非洲生意其实是这样的:10万元的货,运到非洲某国,如果一路上没有任何差错,能卖到28万元。这是180%的利润!可是这个非洲国家的政局不太稳定,腐败横行,你们这批货有50%的可能会被直接没收,那就是血本无归,利润是 -100%。
考虑到概率,这批货到非洲的“数学期望值”,是
180% × 0.5 - 100% × 0.5 = 40%
正好是40%的利润。
如果你有很多钱,每两个月都能拿出几十万元来做一次这样的生意,那么长期下来,你的确能收获40%的平均利润,你不用在乎风险。这个道理我们前面《怎样用系统下一盘大棋》这期讲过,应该考虑系统。
但是如果你只有这10万块钱,这个生意你恐怕就不能做了。是,数学期望是正的,无数个平行宇宙里的我平均下来能赚到40%。可是这10万元我输不起。
换一种情况,如果有一半的可能性赚到80%,一半的可能性不赚不赔,这也算有风险,平均下来也是40%的利润,可是这个生意你就可以做。
所以只考虑数学期望是不够的。我们必须考虑风险的大小。
“标准差”,就是专门描写风险大小的概念。
2.正态分布
世界上大多数“不确定性”的事物,都可以用正态分布来描写。咱们先说说什么是正态分布。
把一个学校里的所有学生都放一起,看看他们的身高是怎么“分布”的 —— 也就是统计在每一个身高数值上有多少人 —— 结果差不多都是下面这样的形状:
身高中等的人数最多,特别矮和特别高的人都很少,整个形状是中间高、两边低。在这张图上1米65是中等身高,这也基本上是所有人的平均身高。
为什么会是这样呢?我们可以想象身高是一系列基因互相配合的结果。所有相关基因都表现的很“好”,身高才能达到最高;所有相关基因都表现“不好”,身高才能达到最低。这两种极端情况既然需要这么多基因同时好或者不好,出现的概率必然很低。大多数情况下有的基因表现好有的基因表现不好,结果就是身高中等。
如果把上面这个分布图取一个光滑的极限,它就是一条“钟形”曲线 —— 这就是著名的“正态分布”。下面这张图,是分别统计的男性和女性身高正态分布曲线 ——
生活中绝大多数受随机因素综合影响的事物,基本上都符合正态分布。身高和智商是典型的正态分布。考虑一笔投资,你可以把未来的各种可能性,当成正态分布。
当然也有一些事物不是正态分布,比如人的财富、城市的大小就更接近于所谓“幂率分布” —— 这是因为它们不是独立的随机事件,越有钱的人会越有钱,越大的城市越吸引人。但即便不是严格的正态分布,你做理论评估的时候也可以把它当做正态分布,有个理论总比没有强。
从数学上来说,每一个正态分布的图形,都是由两个变量完全决定的。一个是平均值,一般用 μ 表示,它决定了曲线的位置,是整个曲线正中间的一点。另一个就是“标准差”,数学符号是 σ(sigma,西格玛),它决定了曲线的宽度。
下面这张图直观地表现了 μ 和 σ 的意义 ——
就拿咱们前面说的那个投资的例子来说,平均利润是固定的40%,那么 μ = 0.4。而不同的投资风险大小不同,所以 σ 不一样。如果你有时候能赚180%有时候却是 -100%,那曲线的宽度就非常大,说明 σ,也就是标准差,很大。
对专业选手来说,一说标准差,他就能大概估计各种情况发生的概率大小。
我们还是拿身高说话,如上图所示,有68%的人的身高是处在距离平均值一个标准差的范围内。换句话说大多数人的身高都在平均值附近,不超过一个标准差。距离平均值两个标准差内的人数就能达到95%,三个标准差就是99.7%。
你可能听过做质量管理的人有个术语叫“六西格玛”,它的意思就是在六个标准差之内出的产品都是合格的。六个标准差是什么概念呢?它覆盖了99.99966%的范围。
我们平时说的“智商”,现在科学的定义并不是什么“智力年龄除以心理年龄”,而是也是用标准差定义的。所有人的智商成正态分布,我们把所有人的平均智商设定为100。然后向右、向左,每经过一个标准差的范围,智商加减15分 ——
所以智商低于100一点都不可怕,智商的定义就是有一半人的智商要低于100!智商在85到115的人处在一个标准差的范围内,而我们知道有68%的人都在这里。如果你的智商是130,那你就是在两个标准差之外,你比97%的人聪明。如果你的智商是145,你就在三个标准差之外,进入了占人口总数0.1%的高智商集团。
智商都是跟别人比较的结果。任何一个智商测验,一个人考完了就直接打分都是不太合理的,应该所有人都考一遍,看看总体的分布,才能决定答对多少道题相当于智商是多少分。
好,现在我们在“数学期望” —— 也就是平均值 —— 之外,又有了一个关键概念,标准差。标准差的大小描写了正态分布的宽度。标准差,代表风险。
3.人生的标准差
咱们考虑一下下面这张图,它描写了 A 和 B 两项投资。横坐标代表各种可能的回报率,纵坐标代表每个回报率发生的可能性大小。两个投资的平均预期回报率都是10%,但是 A 的标准差很小。请问你选哪个呢?
选 A 是稳定的回报,选 B 可能有惊喜,但是也有赔本的风险。
如果你足够理性,就别指望什么惊喜。平均预期已经告诉你了是10%,任何好运气都会被坏运气抵消。正如我们前面分析的非洲生意那样,你应该坚决选 A。
说到这里我想起以前听说的一个调查。有人问过怀孕的夫妇,说根据你们两个的智力,如果现在设定你们孩子的智商的均值预期是110,但是你可以选择一个标准差,你会选多大的标准差?如果你选一个比较大的标准差,可能会收获惊喜,生出来一个智商140的孩子,但也可能会收获不幸,智商只有80。结果几乎所有家长都选了一个非常非常小的标准差,宁可孩子不是聪明过人,也千万不要太傻了。
所以我们是真的不喜欢风险。
下面这张图是我画的,这三个分布代表三种人生。
A 分布代表中国所有的人。中国人的日子现在很不错,所以 A 分布的均值是正的 0.05。但是 A 分布的标准差很大,这意味着全国有很多人的生活比平均水平好很多,也有很多人的生活不太好。
B 分布代表理想人生。均值很高,而且标准差很小,简直是苏东坡说的“无灾无难到公卿”。可是世界上哪有这么好的事儿,所以人们的理性期待,是 C 分布。
C 分布的均值也是0.05,但是标准差比较小,相当于“平平淡淡过一生”。
但我们前面所有这些分析说的就是,C 也是一个奢望。平安是一种福气!低标准差,是更值钱的。
预期回报率相同的情况下,我们肯定选标准差低的那个。所以任何一个投资项目,想要让人接受一个很大的标准差,就必须提供一个很高的回报率。真正值得犹豫考虑的投资,是下图中的这两个 ——
A 的标准差比 B 小,但是 B 的预期回报比 A 大。也许 A 相当于买债券,B 相当于买股票。
那这种情况选 A 还是选 B 呢?答案就不是显然的了。有人认为评估一项投资的价值应该用预期回报除以标准差,这个比值叫“夏普比率(Sharpe ratio)”。按这个标准,你要让我接受多一倍的标准差,就得把回报率也给我提高一倍才行。
我并不认为夏普比率有什么科学根据,它只是一个主观的标准。但是这个道理非常简单:更大的风险要求更高的回报。