1.朴素贝叶斯分类器为什么引入拉普拉斯平滑?
为了防止条件概率P(X|Y)出现概率为0
2.什么时候使用EM算法?E和M分别做什么?
如果概率模型的变量都是观测变量,则给定数据之后,可以直接用极大似然估计法或者贝叶斯估计法来估计模型参数。
但是当模型含有隐变量时,就不能简单的使用这些估计方法。此时需要使用EM算法。
• EM算法是一种迭代算法。
• EM算法专门用于含有隐变量的概率模型参数的极大似然估计,或者极大后验概率估计。
EM算法的每次迭代由两步组成:
• E步求期望。
• M步求极大。
所以EM算法也称为期望极大算法。
3