1. 前提推导
2. EM算法
EM算法就是含有隐变量的概率模型参数的极大似然估计法。
延森不等式(Jensen's inequality)以丹麥數學家約翰·延森(Johan Jensen)命名。它給出積分的凸函數值和凸函數的積分值間的關係。延森不等式有以下推論:過一個凸函數上任意兩點所作割線一定在這兩點間的函數圖象的上方
无监督分类:聚类,EM。
问题:已知10000个人的身高,h1,h2,h3...h1000,样本中存在男性女性。假设身高分别服从两个高斯分布(男N(μ1,σ1);女N(μ2,σ2))。试着估计μ1, σ1, μ2, σ2。
如:已知先验概率,男被选中概率为80%,女被选中概率20%。对于某一样本,P(s = 男 | 1.98) = 0.3, 0.8 * 0.3 = 0.24。P(s = 女 | 1.98) = 0.01,0.2*0.01 = 0.002。0.24/0.24+0.002 = ??(归一化)=>γ(男,198) = 0.99,γ(女,198) = 0.01。
把算出来的π1,π2,μ1,μ2,∑1,∑2带回到第一步重新计算,再得出新的π1,π2,μ1,μ2,∑1,∑2,循环往复,直至收敛。(无法达到全局最优解,且初始值不能随便取)