1、贝叶斯分类方法是统计学的分类方法,它利用概率统计知识预测给定元组属于特定类的概率。
2、贝叶斯分类源于贝叶斯定理,最简单的贝叶斯分类算法是朴素贝叶斯分类法。该方法虽然简单,但是在实际应用上表现出了很高的准确率和效率,而且可以用到大型数据库中。
3、我们先聊了解下贝叶斯定理是怎么一回事儿。
给出情景:有一批产品,在机器良好的时候生产产品合格的概率为70%,在机器故障的时候生产产品合格的概率为30%,机器良好的概率为60%,那么当我们生产出的产品合格时,机器良好的概率为多少?
1)先根据语句写出已知条件:假设机器良好为A1,机器故障为A2,产品合格为B
P(B|A1)=70%, P(B|A2)=30%,P(A1)=60%
2)可知先验概率 A1:A2=60%:(1-60%)=6:4
似然函数 P(B|A1)=70%:P(B|A2)=30%=7:3
两两相乘得42:12
42+12=54便是全概率公式计算出来的值
故而得出后验概率为42/54=7/9
3)作图来直面一下过程:(把先验概率写x向,证据因子写y向)
4)贝叶斯定理公式:
5)并且,比值 P(B|A)/P(B)>1,意味着"先验概率"被增强,事件A的发生的可能性变大;
=1,意味着B事件无助于判断事件A的可能性;
<1,意味着"先验概率"被削弱,事件A的可能性变小。
4、朴素贝叶斯分类有一个简单的前提假设,即属性之间是条件独立的,也叫做类条件独立性假设。
5、举例说明
6、朴素贝叶斯的优缺点:
它的优势在于它易于实现,而且在大多数情况下能够获得较好的分类准确率。劣势在于它的类条件独立性假设,如果数据的各个属性之间有较强的依赖关系,那么朴素贝叶斯就不能取得较好的结果。
7、如何处理属性之间的依赖关系呢?
贝叶斯信念网络告诉你做人的道理~