大数据中的统计学基础——Day5

本章内容:

  1. 导数与微积分公式
  2. 二维随机变量、联合分布
  3. 多维随机变量、边缘分布
  4. 条件分布
  5. 随机变量之间的独立性

一、导数与微积分公式

分部积分法:

二、二维随机变量、联合分布

一般,设E是一个随机试验,它的样本空间是S={e},设X=X{e}和Y={e}是定义在S上的随机变量,由X与Y构成的向量(X,Y)叫做二维随机向量或是二维随机变量(Twodimensional random vector)

联合分布函数:
1、定义

设(X,Y)是二维随机变量,对于任意实数x,y,二元函数: F(x,y)=P{(X≤x)∪(Y≤y)}=P{X≤x,Y≤y} ,称为二维随机变量(X,Y)的联合分布函数(Joint probability distribution)

2、性质
示例:

设随机变量(X, Y)等可能地取值:(0, 0), (0, 2), (2, 0), (2, 2), 求X, Y的联合分布函数

离散型二维随机变量:

如果二维随机变量(X,Y)全部可能取到的值是有限对或是可列无限对,则称(X,Y) 为离散型的二维随机变量。

连续型二维随机变量:

如果对于二维随机变量(X,Y)的分布函数F(x,y),存在非负可积函数f(x,y)使得对 于任意x,y有

称(X,Y)为连续型的二维随机变量。函数f(x,y)称为二维随机变量(X,Y)的联合概率密度(Joint probability density )

联合分布律:

对于离散型的二维随机变量(X,Y)的所有可能取值为(xi,yi),I,j=1,2,……,称 P{X=xi,Y=yi}=pij,i,j=1,2,…… 为随机变量X和Y的联合分布律( Joint distribution law )

性质:
联合概率密度的性质:
示例:

三、多维随机变量、边缘分布

多维随机变量:

设E是一个随机试验,它的样本空间是S={e},设X1=X1{e},X2={e},……,Xn=Xn{e} 是定义在S上的随机变量,由Xi构成的向量(X1,X2,……,Xn)叫做多维随机向量或是多维随机变量( Multidimensional random vector )

对于任意x1,x2,……,xn,函数F(x1,x2,……,xn)= P{X1≤x1, X2≤x2,……Xn≤xn}称为n维随机变量的分布函数

边缘分布:

在多维随机变量中,将X,Y各自的分布称为边缘分布函数( Marginal distribution ),分别记为

边缘分布律:
边缘概率密度:

对于连续型随机变量(X,Y),它的联合概率密度为f(x,y),则关于X和关于Y的边缘概率密度( Marginal probability density )如下:

边缘分布函数与边缘概率密度的关系:
示例:

四、条件分布

对于离散型二维随机变量:
对于连续型二维随机变量:

引入条件概率密度的概念,对于连续型随机变量(X,Y),其联合概率密度为f(x,y),(X,Y)关于Y的边缘概率密度为 𝑓𝑌(𝑦)。若对固定的y, 𝑓𝑌𝑦 > 0,则称𝑓(𝑥,𝑦) /𝑓𝑌(𝑥) 为在Y=y条件下X的条件概率密度

示例:
各种分布之间的关系:

五、随机变量的独立性

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。