第12课:朴素贝叶斯分类器– 从贝叶斯定理到分类模型
朴素贝叶斯定理是分类模型的概率统计基础。贝叶斯公式的推导和使用是非常简单的。在几种Ai可能的集合中,贝叶斯定理可以用下式表示:
某 AI 公司招聘工程师,来了8名应聘者,这8个人里,有5个人是985院校毕业的,另外3人不是。
面试官拿出一道算法题准备考察他们。根据以前的面试经验,面试官知道:985毕业生做对这道题的概率是80%,非985毕业生做对率只有30%。
现在,面试管从8个人里随手指了一个人——小甲,让 TA出来做题。结果小甲做对了,那么请问,小甲是985院校毕业的概率是多大?
朴素贝叶斯分类器在做预测的时候有以下条件:
[if !supportLists]l [endif]有一个朴素贝叶斯分类模型(器),它能够区分出 k 个类 (c1,c2,…,ck)(c1,c2,…,ck), 用来分类的特征有 n 个:(F1,F2,…,Fn)(F1,F2,…,Fn)。
[if !supportLists]l [endif]现在有个样本 s,我们要用 NB分类器对它做预测,则需要先提取出这个样本的所有特征值 F1F1 到 FnFn,将其带入到下式中进行 k 次运算:
第13课:条件参数的概率估计
频率不等于概率
[if !supportLists]1. [endif]有效性:统计量的值不会完全等于该参数的真值,但是应该相差无几。
[if !supportLists]m [endif]费歇尔提出了MLE概念,就是Maximum Likelihood Estimator的概念。他不仅证明了MLE是一致的,还证明了如果人们认可正则性条件是一致的假定,那么MLE是所有统计量中最有效的。
[if !supportLists]m [endif]什么是中心极限定理?大量数据集合的平均数都有一个统计分布,中心极限定理证明这个分布无限接近正态分布,也就是高斯分布(bell-shaped curve)。
[if !supportLists]m [endif]正态分布的参数:平均数和标准差,另外两个对称性偏度(symmetry)和峰度(kurtosis)均为零。在建模时,必须假设所有的数据都服从正态分布。