PRMLP18-P22.5

现在考虑一个概率密度p_{x}(x),它对应于一个关于新变量y的概率密度p_y(y),这充分的表示p_{x}(x)p_{y}(y)实际上是两个不同的密度。落在范围(x,x+\delta x)的观察值(对一个小的\delta x)将被换到范围(y,y+\delta y),其中p_{x}(x) \delta x\simeq p_{y}(y)\delta y,因此

                                                                                   p_{y}(y)=p_{x}\vert \frac{dx}{dy} \vert g^{\prime}(y) \vert \tag{1.27}

这个特征的一个结果是概率密度的最大值的概念只取决于变量的选择。

     在间隔(-∞,z)x的概率由累积分布函数定义为

P(z)=\int^z_∞p(x)dx\tag{1.28}

满足 P^{\prime}(x)=p(x),如图1.2所示。

如果我们有一些连续变量x_1,...,x_D,整体记作向量x,然后我们可以定义一个联合概率密度p(x)=p(x_1,...x_D),使得x落在包含x的无穷小体积\delta x内的概率由p(x)\delta x给出。这个多元概率密度一定满足

p(x)\geq 0\tag{1.29}\int p(x)dx=1\tag{1.30}

其中,积分必须在整个x空间上进行。我们也可以考虑离散变量和连续变量相结合的联合概率分布。

注意到如果x是个离散变量,那么p(x)有时被叫做概率质量函数,因为它可以被看做集中在x的允许值的一组概率质量的集合。

概率的求和和乘积规则以及贝叶斯定理,同样适用于概率密度的情况,和离散和连续变量的组合的情形下。例如如果x和y是两个实变量,那么求和和乘积规则采取如下形式。p(x)=\int {p(x,y)}dy \tag{1.31}p(x,y)=p(y|x)p(x) \tag{1.32}

对连续变量求和和乘积规则的正式证明(Feller,1966)需要一个叫做测度论的数学分支,这不在本书的范围之内。然而,它的正确性可以被非正式地看到,通过将每个实变量除以宽度为Δ的区间,并考虑这些区间上的离散概率分布。取极限Δ→0,然后将和转化为积分,就得出了期望的结果。

1.2.2 期望和方差

涉及到概率的一个重要的操作是找到函数的加权平均值。在概率分布p(x)下,若干函数f(x)的平均值被称为函数f(x)的期望,并用E[f]表示。对一个离散分布,形式为

E[f]=\int{p(x)f(x)dx}\tag{1.33}

所以平均值是不同x值的相对概率的加权。在连续变量的情形,期望被表示为相应概率密度的积分。E[f]=\int{p(x)f(x)dx}\tag{1.34}

在这两种情况下,如果我们从概率分布或概率密度中得到有限的N个点,那么期望可被近似为这些点的有限加和。E[f]\simeq \frac{1}{N}\sum^N_{n=1}f(x_n)\tag{1.35}

在第十一章讨论抽样方法时,我们将经常使用这一结果。当N\rightarrow \infty时,(1.35)中的近似变得精确。

有时我么将考虑多变量函数的期望,在这种情况下,我们可以使用一个下标来表示哪个变量被取平均,比如说E_{x}[f(x,y)]\tag{1.36}

表示函数f(x,y)关于x的分布的平均值,注意E_{x}[f(x,y)]是一个y的函数。

我们也可以考虑关于条件分布的条件期望,E_{x}{[f|y] } = \sum_{x}{p(x|y)f(x)}\tag{1.37}

对于连续变量有类似的定义。

f(x)的方差定义var[f]=E[{(f(x)-E(f(x))}^2]\tag{1.38}

并提供了一个f(x)在它平均值附近变化程度的度量。把平方项展开,我们看到方差可以被写为f(x)f(x)^2的期望的形式。var[f]=E[f(x)^2]-E[f(x)]^2\tag{1.39}

特别的,我们可以考虑变量x它自己的方差,这被给为var[x]=E[x^2]-E[x]^2\tag{1.40}

对两个随机变量x和y,协方差被定义为\begin{align}cov[x,y]&=E_{x,y}[\{x-E[x]\}\{y-E[y]\}]\\&=E_{x,y}[xy]-E[x]E[y]\tag{1.41}\end{align}

补充证明,来自知乎Michael Tan

这表示x和y共同变化的程度,如果x和y是独立的,那么它们的协方差是0。

在随机变量x和y的两个向量的情况下,协方差是一个矩阵\begin{align}cov[x,y]&=E_{x,y}[\{x-E[x]\}\{y^T-E[y^T]\}]\\&=E_{x,y}[xy^T]-E[x]E[y^T]\tag{1.42}\end{align}

如果我们考虑向量x各分量之间的协方差,那么我们使用稍微简单一点的符号cov[x]≡cov[x, x]

1.2.3 贝叶斯概率

本章目前为止,我们已经从随机、可重复事件的频率来看待概率。我们将把这称为概率的经典或频率论解释。现在我们转向更一般的贝叶斯观点,其中概率提供了不确定性的量化。

考虑一个不确定的事件,例如,月球是否曾经在自己的轨道上围绕太阳运行,或者北极冰盖是否会在本世纪末消失。这些事件不能重复很多次来定义概率的概念,就像我们之前在水果箱的例子中做的那样。然而,我们通常会有一些想法,例如,我们认为极地冰融化的速度有多快。如果我们现在获得新的证据,例如从一颗新的地球观测卫星收集到新形式的诊断信息,我们可能会修改我们对冰盖融化速率的看法。我们对这些问题的评估将影响我们采取的行动,例如我们努力减少温室气体排放的程度。在这种情况下,我们希望能够量化我们对不确定性的表达,并根据新的证据对不确定性进行精确的修正,以及随后能够采取最佳行动或决策。这一切都可以通过优雅的,非常普遍的概率的贝叶斯解释来实现。

然而,使用概率来表示不确定性,并不是一个临时的选择,而是不可避免的,如果我们要尊重常识,同时做出合理的连贯推论的话。例如,Cox(1946)证明了如果用数值来表示置信度,那么一套简单的公理就可以编码这种置信的普遍特征,从而唯一地推导出一套操作置信度的规则,这相当于概率的加和与乘积规则。这提供了第一个严格的证明,即概率论可以被视为布尔逻辑在涉及不确定性情况下的延伸(Jaynes, 2003)。许多其他作者提出了不同的性质集或公理集,这些性质或公理是不确定性的度量应该满⾜的(Ramsey, 1931; Good, 1950; Savage, 1961; deFinetti, 1970; Lindley, 1982)。在每一种情况下,所产生的数字量都精确地按照概率的规则来表现。因此,将这些数量称为(贝叶斯)概率是很自然的。

在模式识别领域,对概率有一个更加通用的观点同样是很有帮助的。考虑第1.1节中讨论的多项式曲线拟合的例子。对于观察到的变量t_n这⼀随机值的概率,应⽤频率学家的观点似乎是很合理的。然而,我们希望解决并量化围绕模型参数w的适当选择的不确定度问题。我们将看到,从贝叶斯的角度来看,我们可以使用概率论机制来描述诸如w等模型参数的不确定性,或者说是模型选择本身的不确定性。

贝叶斯理论现在获得了一个新的意义。回顾一下,在水果盒子的例子中,对水果种类的观察提供了相关的信息,改变了所选盒子是红色的概率。在这个例子中,贝叶斯定理被用来将先验概率转换为后验概率,并将观察到的数据所提供的证据纳入其中。我们将在后面详细说明,在对诸如多项式曲线拟合例子中的参数w等量进行推断时,我们可以采用类似的方法。在观察数据之前,我们以先验概率分布p(w)的形式捕获关于w的假设。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,367评论 6 512
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,959评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,750评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,226评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,252评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,975评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,592评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,497评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,027评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,147评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,274评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,953评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,623评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,143评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,260评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,607评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,271评论 2 358

推荐阅读更多精彩内容