这一篇我们介绍另一种生成式模型, 高斯判别分析。
给定数据集,
,
我们对数据模型有一些前提假设:
, 即
所以
从上一节,我们已经知道了现在我们的目标是最大化联合概率,
即 最大化
对数似然估计
目标就是求 , 使得联合概率的极大似然估计最大。
(a)先求, 看
中的最后一项,
, 设为A
所以,
推出, 其中
。
(b)接下来求,
中的第一项,
把上式记为
解得,同理可求得
(c)接下来是最难求的,
我们首先来看
最后一项其实是 1*p 的向量, p*p的矩阵, p*1的向量, 所有结果是1*1, 我们加上迹操作,是不影响结果的。
其中s指的是类内部的协方差矩阵
现在我们回到
记为
,
其中
所以
综上,我们从现有样本,通过最大化联合概率,可以求出, 当有新的样本时,比较
和
的大小关系即可判断具体类别。
生成式模型会暂时告一段路,核心就是对联合概率建模
转载请注明,谢谢