朴素贝叶斯模型和条件参数的概率估计

第12课:朴素贝叶斯分类器– 从贝叶斯定理到分类模型

朴素贝叶斯定理是分类模型的概率统计基础。贝叶斯公式的推导和使用是非常简单的。在几种Ai可能的集合中,贝叶斯定理可以用下式表示:


某 AI 公司招聘工程师,来了8名应聘者,这8个人里,有5个人是985院校毕业的,另外3人不是。

面试官拿出一道算法题准备考察他们。根据以前的面试经验,面试官知道:985毕业生做对这道题的概率是80%,非985毕业生做对率只有30%。

现在,面试管从8个人里随手指了一个人——小甲,让 TA出来做题。结果小甲做对了,那么请问,小甲是985院校毕业的概率是多大?



朴素贝叶斯分类器在做预测的时候有以下条件:

[if !supportLists]l  [endif]有一个朴素贝叶斯分类模型(器),它能够区分出 k 个类 (c1,c2,…,ck)(c1,c2,…,ck), 用来分类的特征有 n 个:(F1,F2,…,Fn)(F1,F2,…,Fn)。

[if !supportLists]l  [endif]现在有个样本 s,我们要用 NB分类器对它做预测,则需要先提取出这个样本的所有特征值 F1F1 到 FnFn,将其带入到下式中进行 k 次运算:




第13课:条件参数的概率估计


频率不等于概率

[if !supportLists]1.  [endif]有效性:统计量的值不会完全等于该参数的真值,但是应该相差无几。

[if !supportLists]m  [endif]费歇尔提出了MLE概念,就是Maximum Likelihood Estimator的概念。他不仅证明了MLE是一致的,还证明了如果人们认可正则性条件是一致的假定,那么MLE是所有统计量中最有效的。

[if !supportLists]m  [endif]什么是中心极限定理?大量数据集合的平均数都有一个统计分布,中心极限定理证明这个分布无限接近正态分布,也就是高斯分布(bell-shaped curve)。

[if !supportLists]m  [endif]正态分布的参数:平均数和标准差,另外两个对称性偏度(symmetry)和峰度(kurtosis)均为零。在建模时,必须假设所有的数据都服从正态分布。


©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容