连续型随机变量 Continuous Random Variables 及其概率分布

连续型随机变量与离散型随机变量相比,其概率分布最大的不同是连续型随机变量是在某个区间内连续取值,并且可以认为其取得某个具体数值的概率为 0。正因为如此,在讨论连续型随机变量的概率分布时,我们更关心的是它在某一个区间上的概率密度函数 Probability Density Function,依然用 ƒ(x) 表示,这个函数在某个区间上的积分则对应随机变量的取值落在这个区间的概率。

均匀分布 Uniform probability distribution

如果一个随机变量在一个区间 [a,b] 内取得任意一个值的概率相同,则可以称这个随机变量在此区间上服从均匀分布,其概率密度函数可以定义为:

  • 如果 a ≤ x ≤ b,则 ƒ(x) = 1 / (b - a),否则 ƒ(x) = 0

由上式可知,其概率密度函数与取值区间实际上构成了一个面积为 1 的矩形,而高度则是宽度的倒数,在考虑某个区间内取值的概率时,只需要计算这个区间对应的矩形面积即可:

Probability calculations for variables with uniform distribution

连续型随机变量的期望和方差同离散型随机变量定义相同,但需要通过积分进行计算:

  • E(x) = ∫xƒ(x)dx = (a + b) / 2

  • Var(x) = ∫(x - E(x))2ƒ(x)dx = (b - a)2 / 12

正态分布 Normal probability distribution

正态分布是现实世界中最为常见的一种分布形态,其钟形的曲线直观的表明了随机变量的取值围绕均值的分布形态:在均值附近取值的概率最高,偏离均值越远的位置取值的概率越低。考虑到正态分布的多见,可以将这个“正态”理解为正常状态下的随机变量的分布,其他的可以认为是特例。

其概率密度函数为:

  • ƒ(x) = e-(x - μ)2/2σ2 / σ(2π )1/2

在一个正态分布中,曲线最高点的横坐标为均值,即均值决定了分布的位置,而标准差则决定了曲线是否扁平或者瘦长:标准差越大,取值离散程度越高,也即相对均值偏离的程度越高,对应的曲线也越扁平,反之亦然。

Normal distribution

标准正态分布 Standard normal distribution

将均值为 0,方差为 1 的正态分布称为标准正态分布,为了表明其特殊性,通常用 z 来表示遵循这个分布的随机变量,这个 z 也就是之前定义的标准值 z-score:

zi = (xi - μ) / σ

因此标准正态分布的概率密度函数相应的可以变为:

  • ƒ(z) = e-z2/2 / (2π)1/2

由于标准正态分布的概率分布只取决于 z 值,因此可以利用已经计算好的标准正态分布表来查找对应某个 z 值区间内的概率。更进一步地,标准值 z 除了可以在任意形态的分布中描述随机变量的某一个取值在所有可能取值中的相对位置外,其更为重要的意义是对于任意的一个正态分布来说,都可以通过计算 z 值来借助标准正态分布表来辅助计算概率。

例如,对于一个 μ = 10,σ = 2 的正态分布,如果想知道随机变量的取值在 10 ≤ x ≤ 14 这个范围内的概率,其计算方式为:

  1. 对于 x = 10,z = (x - μ) / σ = 0,对于 x = 14,z = (x - μ) / σ = 2

  2. 查找标准正态分布表,可知 P(z ≤ 2) = 0.9722,而 P(z ≤ 0) = 0.5,所以有 P(0.5 ≤ z ≤ 2) = 0.9722 - 0.5 = 0.4722,也即 10 ≤ x ≤ 14 的概率

以正态分布来近似计算二项分布

离散型随机变量及其分布 中提到二项分布是对一个单次试验只有两个取值且取值概率 p 稳定不变的多次独立重复试验,借此考察结果中出现 x 个概率为 p 的项的概率 P(x) = ƒ(x) = px(1-p)n-x n! / [x!(n - x)!]。从这个计算公式可看出,当 n 非常大时,手动的计算阶乘是十分困难的。此时若 np ≥ 5 且 n(1 - p) ≥ 5 时,可以采用正态分布来近似计算二项分布,且在正态分布中 μ = np,σ2 = np(1 - p)。

Normal approximation of binomial distribution

对于图中这个例子,如果想知道 x = 12 这个离散型随机变量的概率,则可以转化为计算正态分布中 P(11.5 ≤ x ≤ 12.5) 这个连续性随机变量的概率,其中 0.5 为保证正态分布计算的是一个区间值而采用的连续修正系数 continuity correction factor。进一步地,可以再通过将正态分布标准化为标准正态分布来计算这个概率。这一近似对于计算 x 小于等于某个数值时更为简便,可以省略逐个计算再加和的过程,例如如果想计算 x &le 13; 的概率则可以直接计算正态分布中 P(x ≤ 13) 的概率。

指数分布 Exponential probability distribution

指数分布希望了解对于在单位时间内具有一定发生频次 λ 的某个事件来说 t 时间内发生的概率,或者说发生的时间间隔最多为 t 的概率。其概率密度函数为

  • ƒ(x) = λe-λx,其中 x ≥ 0

通过积分计算可知,相应的概率为 P(x ≤ t) = 1 - e-λt,其中 t ≥ 0。

由于泊松分布描述的某个具有一定发生频率 λ 的事件 t 时间内发生 x 次的概率,对应同一事件的指数分布则描述的是这个事件两次发生的时间间隔最高为 t 的概率,所以指数分布的概率计算也可以通过泊松分布来计算:即可以将这个概率描述为 1 减去 t 时间内发生次数为 0 的概率 ƒ(0) = (λt)0e-λt / 0! = e-λt

通过积分计算可知,对于指数函数来说其期望和标准差相等,均为 1 / λ。

Exponential distribution

免责声明

我写这个笔记是为了系统的复习概率论中的一些概念,阅读的是 Statistics for Business and Economics, 12th Edition 英文原版,这是一本非常经典的参考书,毫无保留的满分推荐。尽管书名暗示了是在商业和经济学中的统计学,但根本的统计学知识是不变量,并且和很多优秀的原版书一样,作者时刻注意用实例来讲解统计学概念,基本上每一个新的概念的定义都建立在日常生活的实例的基础上,在此基础上还保留了精美的排版和精心设计的插图,十分便于理解。

笔记最重要的一个目的就是记录者复习的重要资料,如果能对别人也有所帮助那就是额外的奖赏了,所以为了复习方便我擅自截取了书中的很多插图,这些插图仅限于个人学习使用。其他人请勿直接转载,如转载请删除插图并附带这则免责声明,否则由此而产生的版权问题,请转载者自行承担。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,904评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,581评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,527评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,463评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,546评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,572评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,582评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,330评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,776评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,087评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,257评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,923评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,571评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,192评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,436评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,145评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352