大偏差原理:文献综述

大偏差技术旨在对稀有事件的概率做指数型的渐进估计。大偏差原理的框架最早由Abel奖得主Varadhan于1966年引入,我们如今沿用的记号和定义即是Varadhan当初所提出的。但大偏差技术的雏形要更早,可以追溯到Cramer关于独立同分布随机变量列的样本均值尾概率估计的工作。

继大偏差的框架被引入之后,上世纪七八十年代,Donsker-Varadhan提出了关于马氏过程经验测度的大偏差,Freidlin-Wentzell提出了含随机扰动系统的轨道大偏差。这两大辉煌成就,让大偏差原理迅速成为概率论的主流分支之一。

如今常见的大偏差原理有3类:
level 1:随机变量列的大偏差(Cramer’s Theorem,Gartner-Ellis' Theorem
level 2:马氏过程经验测度的大偏差(Sanov's Theorem
level 3:带扰动系统的轨道大偏差(Schilder's Theorem

大偏差技术最初由Harald Cramer于1944年提出,Cramer利用随机变量对数矩母函数的Fenchel-Legendre变换,给出了独立同分布情形下样本均值小于某个常数c(c严格小于总体均值)的概率的指数型控制。

具体而言,Cramer给出了对样本均值尾概率的指数型控制:
\textbf{P}(\overline{X}=a)\leq \exp(-nI(a)),a\neq EX_1
其中I(a)被称为速率函数,它是对数矩母函数f(t)\triangleq \ln E\exp(tX)Fenchel-Legendre对合,即I(a)=f^{*}(a)\triangleq \sup_{t} (ta-f(t))
由于对数矩母函数是凸函数,且Fenchel-Legendre保凸,故I(a)凸。

Cramer原理的证明十分简单,只需应用Chebyshev不等式,取辅助函数为指数函数\exp(tX),再在右侧对t取上确界即可。

列举几个常用分布的对数矩母函数和速率函数:
1)两点分布B(1,p)
f(t)=\ln(1-p+pe^{t})
I(a)=a\ln(\frac{a}{p})+(1-a)\ln(\frac{1-a}{1-p}),a\in [0,1]
2)泊松分布Possion(\lambda)
f(t)=\lambda(e^{t}-1)
I(a)=a\ln(\frac{a}{\lambda})+\lambda-a,a\in [0,+\infty )
3)正态分布N(0,\sigma^{2})
f(t)=\frac{t^{2} \sigma^{2}}{2}
I(a)=\frac{a^{2}}{2 \sigma^{2}}
4)指数分布Exp(\lambda)
f(t)=\ln(\frac{\lambda}{\lambda-t}),t\in (-\infty,\lambda]
I(a)=\lambda a-1-\ln(\lambda a),a\in[0,+\infty)

Freidlin-Wentzell关于轨道大偏差最早的工作是1979年出版的《Random Perturbations of Dynamical Systems》。在文中他们研究了含有小随机扰动的动力系统,对其样本轨道的收敛速率做了刻画。具体来说,随着噪声\epsilon的减小,样本轨道收敛于确定性轨道的速率关于\epsilon是指数型的。

大偏差的用途广泛,业已成为应用概率中一个极活跃的分支。它能估计假设检验中犯错误的渐进概率,估计随机系统的逸出概率和相对于确定性轨道有偏离的概率。大偏差对稀有事件概率的精确刻画,使得我们能够更精细地更定量地描述渐进行为,从而提高统计和计算方法的精度及效率。大偏差技术还被用于金融风险管理。对一个公司而言,可能导致破产的稀有事件比大概率收益多少要更加重要。

本文拟使用大偏差原理结合Girsanov测度变换,改进路径依赖期权定价的Monte Carlo方法。我们由此将发现,在统计模拟中,一个关于稀有事件概率的先验估计对于计算效率的重要性。

下面我们就几个具体情形简述大偏差的应用:
1)
无论是随机变量的取值集合,还是经验测度的取值集合,抑或是[0,T]区间上样本轨道的集合,样本落在这些集合中便可被视为一个事件。当该集合不含最终收敛到的点、测度或轨道时,\{样本落入该集合\}便是一个稀有事件,拥有指数型的渐进概率。

首先介绍Varadhan引入的大偏差框架,3个level的大偏差在这种描述下拥有统一的定义:

大偏差原理是概率测度族所满足的一种性质。具体来说,测度族\{P_{\epsilon}\}满足以I(a)为速率函数的大偏差原理是指:
1)I(a)\in[0,+\infty]
2)I(a)下半连续\Leftrightarrow\forall l<\infty ,水平集\{a|I(a)\leq l\}是闭集
2')I(a)下紧\Leftrightarrow\forall l<\infty,水平集\{a|I(a)\leq l\}是紧集
3)\forall 闭集C,\limsup_{\epsilon\downarrow 0}\epsilon\ln P_{\epsilon}(C)\leq-\inf_{a\in C}I(a)
4)\forall 开集G,\liminf_{\epsilon\downarrow 0}\epsilon\ln P_{\epsilon}(G)\geq-\inf_{a\in G}I(a)

(1)(2)(2')是对速率函数的要求,(3)(4)分别为大偏差的上、下界估计。若速率函数I(a)满足(2'),则称其为好速率函数(good rate function)。对于一个好速率函数I(a),存在a,使得I(a)=0

在随机变量列或离散状态马氏链的情形,(3)(4)有更常见的写法:
3’)\forall 闭集C,\limsup_{n\to \infty}\frac{1}{n}\ln P_{n}(C)\leq-\inf_{a\in C}I(a)
4’)\forall 开集G,\liminf_{n\to \infty}\frac{1}{n}\ln P_{n}(G)\geq-\inf_{a\in G}I(a)

由于(3)和(4),我们可以对\mathbb{R^{d}}上的BorelB的渐进概率做出上下界估计:
-\inf_{a\in B^{\circ}}I(a)\leq \liminf_{\epsilon\to 0}\epsilon\ln P_{\epsilon}(B)\leq \limsup_{\epsilon\to 0}\epsilon\ln P_{\epsilon}(B)\leq-\inf_{a\in \overline{B} }I(a)
\inf_{a\in B^{\circ}}I(a)=\inf_{a\in \overline{B} }I(a)时,\lim_{\epsilon\to 0}\epsilon\ln P_{\epsilon}(B)=-\inf_{a\in B}I(a),称BI连续集,此时事件B的渐进概率可以由LDP得到精确刻画。

独立同分布情形下,经验测度收敛于先验测度。我们只考虑离散状态随机变量。设Y_1,Y_2,...Y_n,...是一列离散独立同分布的随机变量,状态空间为\Sigma。定义X_i\triangleq (I_{a_1}(Y_i),I_{a_2}(Y_i),...,I_{a_{|\Sigma|}}(Y_i)) ,那么X_1,X_2,...,X_n,...也是一列独立同分布随机向量。有\mathbb{R^{|\Sigma|}}上的Cramer原理,其对数矩母函数:f(\overrightarrow{\lambda} )=\ln E(e^{\langle \lambda,X_1\rangle})=\ln \Sigma_{i=1}^{|\Sigma|}e^{\lambda_i}P(a_i)
计算得其速率函数:I(a)=D(a||P)D(\cdot ||P)称为相对熵,又叫Kullback-Liebler散度,它衡量了两个分布之间的差异,在这里衡量了经验测度a于先验测度P之间的差异。两个测度差异越小,相对熵也越小。D(a||P)\geq 0,当且仅当a=P时取等。D(a||P)是关于a的凸函数。

对于遍历的马氏链而言,其经验测度仍收敛于平稳分布的先验测度。此时仍有经验测度的大偏差原理,称作Sanov's Theorem。由上所述,独立同分布条件下的Sanov's Theorem可看作\mathbb{R^{d}}上Cramer原理的推论。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,616评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,020评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,078评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,040评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,154评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,265评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,298评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,072评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,491评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,795评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,970评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,654评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,272评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,985评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,815评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,852评论 2 351