首先引入的一组概念:随机试验、DGP
公理1:任何一个经济系统都可以看成受到概率法则支配的随机试验(random experiment)。
公理2:任一经济现象都是随机试验的一个实现(realization)。这个随机试验,叫做数据生成过程(DGP)。
随机试验,是指一种至少可能出现两种结果的观察过程(process of observation)。类似于经济学的不确定性的概念。集合论中引入了vector space中的投影和正交基的概念。如果Ai构成了样本空间的一个划分,那么. A是任意一个向量,A可分解到各个基。其中
可以视为A在Ai方向的投影。
概率的两种解释。1,relative frequency。在重复试验多次后事件发生的频次。这种方法依赖于iid的假定。天气预报30%的概率会下雨。这里的30%是指,在同等气象条件下,历史中有30%的天数下雨了。在经济学研究中,可以尝试用历史上的相对频率来预测股票市场的变动。但是,股票市场相较于天气系统更加复杂。股票市场的条件是不可重复的,因此iid假设不满足。2,subjective probability。主观概率方法。
图示:用主观概率进行衍生品定价
条件概率:如果已知event B已经发生,那么对于event A发生的推断会有何影响?用条件概率来度量事件A和B的关联性。可从韦恩图直观地理解条件概率的含义。条件概率表示了A和B的预测关系。但并不一定表示因果关系。因果关系的判断依赖于概率统计外的经济理论。
联合概率公式:. 在MLE计算n个event同时发生的概率,即联合概率时,十分有用。
全概率公式:
proof:
①将event A投影到A1,A2,A3 等正交基,
②应用概率,
③应用条件概率, QED.
贝叶斯定理
例题1:保险公司根据罚单信息给客户分类
例题2:股票分析师的价值
案例:法航飞机在百慕大三角失事。根据贝叶斯法则更新搜寻区域。自动驾驶技术,传感器通过人类的数据学习路况。
由于经济系统时不可逆的,贝叶斯就很有用,根据结果推断原因。根据new information,可以推断以前是什么样的。比如根据罚单推断风险type,根据教育信息推断ability。贝叶斯技术在经济分析,大数据分析,机器学习和人工智能方面发挥着巨大的作用。
独立性,此时
,两者之间不存在任何的预测关系。