朴素贝叶斯
用处:朴素贝叶斯主要解决的是而分类的问题。
为什么叫朴素贝叶斯: 因为贝叶斯分类只做最原始,最简单的假设:所有的特征之间都是统计独立的
什么是统计独立:假设某样本X有个属性,那么有
,满足这样的公式就说明特征统计独立
概率基础
-
联合概率(并且): 包含多个条件,且所有条件同时成立的概率
记为:
计算:
-
条件概率:就是时间A 在另一个时间B已经发生条件下的发生概率
记为:
同理可得
联立可得
也就是贝叶斯公式
特性:
特性成立的条件是
是相互独立的。相互独立的意思就是互相之间没有影响。
-
全概率公式
如果时间
构成一个完备时间且都有正概率,那么对于任意一个事件
则有:
朴素贝叶斯-贝叶斯公式
称为”先验概率“(Prior probablity),即在B时间发生之前,我们对A时间概率的一个判断
称为”后验概率“(Posterior probability), 即在B事件发生之后,我们对A事件的重新评估
称为”可能性函数“(Likely hood),这是一个调整因子,可以使预估概率更加接近真实概率
在计算最终结果的时候,可以将计算步骤分为几个部分,首先计算先验概率的大小,之后计算可能性函数,对于可能性函数,有分为分子的计算和分母的计算,首先计算分母,分母的计算使用到全概率公式计算,将对应的部分套入到公式中
朴素贝叶斯的分类
1. GaussianNB
先验概率是高斯分布,需要求均值和方差