2.3.2 边缘高斯分布

由上一章知道如果联合分布p(x_a, x_b)为高斯分布,则条件概率分布p(x_a|x_b)也是高斯分布,现在讨论边缘概率分布
p(x_a) = \int p(x_a,x_b)dx_b
和上一章一样,我们从联合分布的指数项的二次型出发,找出边缘分布p(x_a)的均值和方差


再次拿出使用分块精度矩阵表示的二次型公式
-\frac{1}{2}(x-\mu)^T\Sigma^{-1}(x-\mu) = \\ -\frac{1}{2}(x_a-\mu_a)^T\wedge_{aa}(x_a-\mu_a)-\frac{1}{2}(x_a-\mu_b)^T\wedge_{ab}(x_a-\mu_b)\\ -\frac{1}{2}(x_b-\mu_a)^T\wedge_{ba}(x_b-\mu_a)-\frac{1}{2}(x_b-\mu_b)^T\wedge_{bb}(x_b-\mu_b)
这次目标是积分出x_b,配出平方能够使得积分更加方便的运算(???)
首先考虑涉及x_b的项,和x_a相反,有\\ -\frac{1}{2}x_b^T\wedge_{bb}x_b + x_b^Tm = -\frac{1}{2}(x_b-\wedge_{bb}^{-1}m)^T\wedge_{bb}(x_b-\wedge_{bb}^{-1}m)+\frac{1}{2}m^T\wedge_{bb}^{-1}m\\ 其中m=\wedge_{bb}\mu_b-\wedge_{ba}(x_a-\mu_a)

上面的公式的右边的第一项就是关于x_b的标准的二次型,第二项是与x_b无关的常数项(但与x_a相关)

p(x_a) = \int p(x_a,x_b)dx_b上,我们取这个标准的二次型作为高斯分布的指数项(因为剩余的常数项可以直接写道积分外面),有
\int exp\{ -\frac{1}{2}(x_b-\wedge_{bb}^{-1}m)^T\wedge_{bb}(x_b-\wedge_{bb}^{-1}m)\}dx_b

为什么要给x_b配平方????
因为高斯分布的系数与均值无关,只依赖于协方差矩阵(在这里是\wedge_{bb}^{-1}),因此即使均值中有关于x_a的项也没有关系,积分结果与均值无关!!!你就想一个高斯分布,均值只决定了高峰在x轴上的哪个位置上而已。


现在我们来考察\exp\{x_a相关 \}的项,因为可以提取出积分外面,暂时不再考虑积分里面x_b的积分结果,结合配方后遗留下来的x_a相关的项(左侧的最后一项)和与在上一章中求过的x_a相关的项,有
\frac{1}{2}[\wedge_{bb}\mu_b-\wedge_{ba}(x_a-\mu_b)]^T\wedge_{bb}^{-1}[\wedge_{bb}\mu_{b}-\wedge_{ba}(x_a-\mu_a)]\\ -\frac{1}{2}x_a^T\wedge_{aa}x_a+a^T(\wedge_{aa}\mu_a-\wedge_{ab}(x_b-\mu_b))+C\\ =-\frac{1}{2}x_a^T(\wedge_{aa}-\wedge_{ab}\wedge_{bb}^{-1}\wedge_{ba})x_a+x_a^T(\wedge_{aa}-\wedge_{ab}\wedge_{bb}^{-1}\wedge_{ba})\mu_a +C

可以看出协方差矩阵\Sigma_a=(\wedge_{aa}-\wedge_{ab}\wedge_{bb}^{-1}\wedge_{ba})^{-1},均值为\mu_a

还记得上一章中分块矩阵的逆矩阵的恒等式,不难得出
\wedge_{aa}-\wedge_{ab}\wedge_{bb}^{-1}\wedge_{ba}^{-1}=\Sigma_{aa}


结论
E[x_a]=\mu_a\\ cov[x_a]=\Sigma_{aa}

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 多元高斯的一个重要性质: 若果两组变量是联合高斯分布,那以一组变量维条件,另一组变量同样是高斯分布。类似的,任何一...
    golfgang阅读 11,552评论 0 5
  • 考试科目:高等数学、线性代数、概率论与数理统计 考试形式和试卷结构 一、试卷满分及考试时间 试卷满分为150分,考...
    Saudade_lh阅读 1,105评论 0 0
  • 2017年考研数学一大纲原文 考试科目:高等数学、线性代数、概率论与数理统计 考试形式和试卷结构 一、试卷满分及考...
    SheBang_阅读 658评论 0 7
  • 考试形式和试卷结构一、试卷满分及考试时间 试卷满分为150分,考试时间为180分钟 二、答题方式 答题方式为闭卷、...
    幻无名阅读 787评论 0 3
  • 二元变量 伯努利分布 似然函数为 对数似然函数为 如果我们令关于u的导数等于零,我们就得到了最大似然的估计值 现在...
    初七123阅读 1,657评论 0 4