如果你想深刻理解人工智能,大数据算法。
概率论必须得懂。
如今最火热的科技技术,无非是机器学习。
深度学习,大数据喂养。
互联网大厂通过海量的数据喂养。
就能知道每个用户的行为特征。
预测用户明天要做什么事。
马云多次提出数据时代。
数据就是新时代的石油。
在中国的数据显然比美国更多。
其实,要理解大数据。
就得先知道,机器学习的逻辑起点是概率论。
理解量子力学的人都能明白。
这个世界是无法预测的。
人也一样,没人能预测明天你要去哪里。
你自己也无法预判,明天你的行程。
大数据如何做得到?
其实大数据,预测的是一种概率。
无法预测你明天的行为。
但知道40%的概率,你会去图书馆。
50%概率你会去郊游。
这是经过大量数据喂养后的确定概率。
概率思维把局部随机,转化为整体的确定性。
没人能精准判断事物的发展。
但是上帝存在的话,一定也是用概率来整体考量事物的。
概率论研究的对象是随机,而不是不确定性。
黑天鹅事件,概率论是无能为力的。
概率论只能研究清楚,一只灰犀牛的确定性。
超出认知边界的问题,无法用概率计算。
随即问题考察的是确定的结果。
只不过不知道哪一个结果会出现。
在某种条件下,用可能性的方式看待结果。
用数学来进行研究。
数值是0到1之间,不可能是负的,不可能超出1。
用事件结果,除以样本空间所有可能的结果。
就是概率。
概率论的计算非常简单,小学四年级就能算对。
难的是如何将现实世界,用正确的概率计算。
这需要我们对样本空间,有深刻的了解。
样本空间,就是所有结果出现的集合。
概率算得准,前提是样本空间得全。
但是,除了全知的上帝之外。
宇宙间还有谁能够知道所有的可能结果?
每个人看待世界的方式,总是视野有限的。
但这并不妨碍我们,尽可能开拓视野。
要算准5部入围奥斯卡最佳电影的获奖概率。
根本不是1除以5,可能有双黄蛋,可能空缺。
可能突然发生战争。
可能平行宇宙对我们的世界产生影响。
我们知道得越多,概率才能接近真实概率。
某种程度上来说我们的认识,即样本空间的完备性。
一些眼界狭窄的人,很多可能性他根本就不知道。
对他来说会出现很多黑天鹅。
眼界开阔的人,把黑天鹅都纳入概率计算当中来了。
上帝由于全职视角,直接清楚真实概率。
人类的视角有限,可以从迭代的贝叶斯公式。
不断迭代自己的认知。
调整对概率的模拟,数据量足够大后,人类视角接近上帝。
人类计算的概率就和上帝视角一致。
概率论是最年轻的一门数学。
创始人是帕斯卡尔,在1654年7月29日给费马写了一封信讨论概率。
帕斯卡尔是我的偶像。
他是数学领域16岁就提出了帕斯卡定律,还是概率论的创始人,统计学的奠基人。
他还是物理学中,压强单位帕就是他的名字,流体能传递压力的了帕斯卡定律。
他还是一位杰出的哲学家,写过《思想录》。
曾经形容人生就像一根会思考的芦苇。
他35岁放弃所有研究事业,直接投奔神学研究上帝。
提出过著名的帕斯卡尔的赌局。
用概率的角度,计算是否应该信仰上帝。
1662年死于巴黎,仅活到39岁。