概率分布基础

基础概念

1.概率

概率直观上是指一个事件发生可能性大小的数量指标

概率的统计定义:在不变的条件下,重复进行nn次试验,事件AA发生的频率稳定在某一个常数pp附近摆动,且一般来说,nn越大,摆动幅度越小,则称常数pp为事件AA的概率,记作P(A)=pP(A)=p.

2.古典概型

当试验结果为有限nn个样本点,且每个样本点的发生具有相等的可能性,如果事件A由nAnA个样本点组成,则事件AA的概率

P(A)=nAnP(A)=nAn

称有限等可能实验中事件AA的概率P(A)P(A)为古典概率.

4.随机变量

定义:在样本空间ΩΩ上的实值函数X=X(ω),ω∈ΩX=X(ω),ω∈Ω,称X(ω)X(ω)为随机变量,简记XX.

4.1 离散型随机变量

离散型(discrete)随机变量即在一定区间内变量取值为有限个或可数个。

4.2 连续型随机变量

连续型(continuous)随机变量即在一定区间内变量取值有无限个,或数值无法一一列举出来。

定义:如果对随机变量XX的分布函数F(x)F(x),存在一个非负可积函数f(x)f(x),使得对任意实数xx,都有

F(X)=∫x−∞f(t)dt,−∞<x<+∞F(X)=∫−∞xf(t)dt,−∞

称XX为连续型随机变量,函数f(x)f(x)称为XX的概率密度。

4.3 期望

离散型

如果XX是离散随机变量,具有概率质量函数p(x)p(x),那么X的期望值定义为E(X)=∑x:p(x)>0xp(x)E(X)=∑x:p(x)>0xp(x)。换句话说,XX的期望是XX可能取的值的加权平均,每个值被XX取此值的概率所加权。

连续型

我们也可以定义连续随机变量的期望值。如果XX是具有概率密度函数f(x)f(x)的连续随机变量,那么XX的期望就定义为E(X)=∫βαxβ−αdx=β2−α22(β−α)=β+α2E(X)=∫αβxβ−αdx=β2−α22(β−α)=β+α2。换句话说,在(α,β)(α,β)上均匀分布的随机变量的期望值正是区间的中点。


常用概率分布

1.二项分布

nn重伯努利试验

定义:把一随机试验独立重复作若干,即各次试验所联系的事件之间相互独立,且同一事件在各个实验中出现的概率相同,称为独立重复试验。

如果每次试验只有两个结果AA和A¯¯¯¯A¯,则称这种试验为伯努利试验。将伯努利试验独立重复nn次,称为nn重伯努利试验。

设在每次试验中,概率P(A)=p(0<p<1)P(A)=p(0

二项分布

如果随机变量XX有分布律

P{X=k}=Cknpk(1−p)n−k,k=0,1,2,⋯,nP{X=k}=Cnkpk(1−p)n−k,k=0,1,2,⋯,n

其中0<p<1,q=1−p0

二项分布就是重复nn次独立的伯努利试验。在nn次伯努利试验中,若每次试验成功率p(0<p<1)p(0

当n=1n=1时,二项分布为0−10−1分布,记B(1,p)B(1,p)

期望:E(gX)=npE(gX)=np,方差:D(X)=np(1−p)D(X)=np(1−p)

2.泊松分布

泊松分布的概率函数为:

P(X=k)=λkk!e−λ,k=0,1,⋯P(X=k)=λkk!e−λ,k=0,1,⋯

泊松分布的参数λλ是单位时间(或单位面积)内随机事件的平均发生次数。 泊松分布适合于描述单位时间内随机事件发生的次数。

泊松分布的期望和方差均为λλ特征函数为ψ(t)=exp{λ(eit−1)}ψ(t)=exp⁡{λ(eit−1)}


泊松分布适合于描述单位时间(或空间)内随机事件发生的次数。如某一服务设施在一定时间内到达的人数,电话交换机接到呼叫的次数,汽车站台的候客人数,机器出现的故障数,自然灾害发生的次数,一块产品上的缺陷数,显微镜下单位分区内的细菌分布数等等

3.均匀分布

在概率论和统计学中,均匀分布也叫矩形分布,它是对称概率分布,在相同长度间隔的分布概率是等可能的。 均匀分布由两个参数aa和bb定义,它们是数轴上的最小值和最大值,通常缩写为U(a,b)U(a,b).

概率密度函数:

f(x)={1b−a,0a<x<b其他]f(x)={1b−a,a

在两个边界aa和bb处的f(x)f(x)的值通常是不重要的,因为它们不改变任何f(x)dxf(x)dx的积分值。 概率密度函数有时为0,有时为1b−a1b−a。 在傅里叶分析的概念中,可以将f(a)f(a)或f(b)f(b)的值取为12(b−a)12(b−a),因为这种均匀函数的许多积分变换的逆变换都是函数本身。

分布函数:

F(x)=⎧⎩⎨⎪⎪0,1b−a,1,x<aa≤x<bb≤xF(x)={0,x

令X1,…,XnX1,…,Xn是服从于U(0,1)U(0,1)的样本。 令X(k)X(k)为该样本的第kk次统计量。 那么X(k)X(k)的概率分布是参数为kk和n−k+1n−k+1的β分布。期望值是:

E(X(k))=kn+1E(X(k))=kn+1

方差是:

V(X(k))=k(n−k+1)(n+1)2(n+2)V(X(k))=k(n−k+1)(n+1)2(n+2)

4.指数分布

在概率理论和统计学中,指数分布(也称为负指数分布)是描述泊松过程中的事件之间的时间的概率分布,即事件以恒定平均速率连续且独立地发生的过程。 这是伽马分布的一个特殊情况。 它是几何分布的连续模拟,它具有无记忆的关键性质。

随机变量XX概率密度函数:

f(x)={λe−λx,0,x>0x≤0λ>0f(x)={λe−λx,x>00,x≤0λ>0

设X∼E(λ)X∼E(λ),则XX的分布函数:

F(x)={1−e−λx,0,x>0,x≤0,λ>0F(x)={1−e−λx,x>0,0,x≤0,λ>0

期望值:E(X)=1λE(X)=1λ

方差:D(X)=Var(X)=1λ2D(X)=Var⁡(X)=1λ2

指数分布是一种连续概率分布。指数分布可以用来表示独立随机事件发生的时间间隔,比如旅客进机场的时间间隔、中文维基百科新条目出现的时间间隔等

5.正态分布

若随机变量XX服从一个位置参数为μμ、尺度参数为σσ的概率分布,且其概率密度函数为

f(x)=12π√σexp(−(x−μ)22σ2)f(x)=12πσexp⁡(−(x−μ)22σ2)

则这个随机变量就称为正态随机变量,正态随机变量服从的分布就称为正态分布,记作X∼N(μ,σ2)X∼N(μ,σ2),读作服从N(μ,σ2)N(μ,σ2),或XX服从正态分布。

参数含义

正态分布有两个参数,即期望(均数)μμ和标准差σσ,σ2σ2为方差。

f(x)=12π√σe−(x−μ)22σ2f(x)=12πσe−(x−μ)22σ2

正态分布具有两个参数μμ和σ2σ2的连续型随机变量的分布,第一参数μμ是服从正态分布的随机变量的均值,第二个参数σ2σ2是此随机变量的方差,所以正态分布记作N(μ,σ2)N(μ,σ2).

μμ是正态分布的位置参数,描述正态分布的集中趋势位置。概率规律为取与μμ邻近的值的概率大,而取离μμ越远的值的概率越小。正态分布以X=μX=μ为对称轴,左右完全对称。正态分布的期望、均数、中位数、众数相同,均等于μμ。

当μ=0,σ=1μ=0,σ=1时,正态分布就成为标准正态分布

f(x)=12π√e(−x22)f(x)=12πe(−x22)

概率论中最重要的分布

正态分布有极其广泛的实际背景,生产与科学实验中很多随机变量的概率分布都可以近似地用正态分布来描述。例如,在生产条件不变的情况下,产品的强力、抗压强度、口径、长度等指标;同一种生物体的身长、体重等指标;同一种种子的重量;测量同一物体的误差;弹着点沿某一方向的偏差;某个地区的年降水量;以及理想气体分子的速度分量,等等。一般来说,如果一个量是由许多微小的独立随机因素影响的结果,那么就可以认为这个量具有正态分布(见中心极限定理)。从理论上看,正态分布具有很多良好的性质 ,许多概率分布可以用它来近似;还有一些常用的概率分布是由它直接导出的,例如对数正态分布、t分布、F分布等

6.χ2χ2分布

若n个相互独立的随机变量ξ₁、ξ₂、……、ξn ,均服从标准正态分布(也称独立同分布于标准正态分布),则这nn个服从标准正态分布的随机变量的平方和Q=∑ni=1ξ2iQ=∑i=1nξi2构成一新的随机变量,其分布规律称为χ2χ2分布(chi-square distribution),其中参数称为自由度,正如正态分布中均数或方差不同就是另一个正态分布一样,自由度不同就是另一个χ2χ2分布。记为Q∼χ2(v)Q∼χ2(v)或者Q∼χ2vQ∼χv2(其中v=n−k,kv=n−k,k为限制条件数)。

卡方分布是由正态分布构造而成的一个新的分布,当自由度很大时,χ2χ2分布近似为正态分布。

7.Beta分布

在概率论中,贝塔分布,也称B分布,是指一组定义在(0,1)(0,1)区间的连续概率分布,有两个参数α,β>0α,β>0。

B分布的概率分布函数为:

f(x;α,β)=xα−1(1−x)β−1∫10uα−1(1−u)β−1du=Γ(α+β)Γ(α)Γ(β)xα−1(1−x)β−1=1B(α,β)xα−1(1−x)β−1f(x;α,β)=xα−1(1−x)β−1∫01uα−1(1−u)β−1du=Γ(α+β)Γ(α)Γ(β)xα−1(1−x)β−1=1B(α,β)xα−1(1−x)β−1

其中Γ(z)Γ(z)是ΓΓ函数。随机变量XX服从参数为α,βα,β的Β分布通常写作X∼Be(α,β)X∼Be⁡(α,β)

性质:

1. 参数为α,βα,β贝塔分布的众数是:

α−1α+β−2α−1α+β−2

2.期望值方差分别是:

μ=E(X)=αα+βμ=E(X)=αα+β

Var(X)=E(X−μ)2=αβ(α+β)2(α+β+1)Var⁡(X)=E(X−μ)2=αβ(α+β)2(α+β+1)

3.偏度是:

E(X−μ)3[E(X−μ)2]3/2=2(β−α)α+β+1√(α+β+2)αβ√E(X−μ)3[E(X−μ)2]3/2=2(β−α)α+β+1(α+β+2)αβ

4.峰度是:

E(X−μ)4[E(X−μ)2]2−3=6[α3−α2(2β−1)+β2(β+1)−2αβ(β+2)]αβ(α+β+2)(α+β+3)E(X−μ)4[E(X−μ)2]2−3=6[α3−α2(2β−1)+β2(β+1)−2αβ(β+2)]αβ(α+β+2)(α+β+3)

或:

6[(α−β)2(α+β+1)−αβ(α+β+2)]αβ(α+β+2)(α+β+3)

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容