2022-02-20

期望值(Expectation )

如果X是在概率空间中的一个随机变量,那么它的期望值E(X)定义为
E(X)=\int_{-\infty}^{\infty} XdF
注意F分布函数并不是每一个随机变量都有期望值的,因为有的时候这个积分不存在,F表达式为
dF=f(x)dx
其中f(x)为概率密度函数。

如果X离散的随机变量,输出值为x_1,x_2,x_3,...,和输出值相应的概率为p_1,p_2,p_3,...(概率和为1),若级数\sum_i x_ip_i绝对收敛,那么期望值E(X)是一个无限数列的和
E(X)=\sum_i x_ip_i

如果X连续的随机变量,存在一个相应的概率密度函数f(x),若积分\int_{-\infty}^{\infty}xf(x)dx绝对收敛,连续期望值E(X)
E(X)=\int_{-\infty}^{\infty}xf(x)dx

性质:
(1)线性运算规则
E(aX+bY+c)=aE(X)+bE(Y)+c
推广到一般情况E(\sum_{i=1}^{n} a_iX_i+c)=\sum_{i=1}^{n}a_iE(X_i)+c
(2)乘积的期望
E(XY)=E(X)E(Y),该式成立的前提是XY不相关(或独立)

方差(Variance)

定义
总体方差 \sigma^2定义为
\sigma^2=\frac{\sum(X-\mu)^2}{N}
X为变量,\mu为总体均值,N总体例数
样本方差 S^2
实际统计计算时,总体均数难以得到时,应用样本统计量代替总体参数,经校正后,样本方差计算公式
S^2=\frac{\sum(X-\overline{X})^2}{n-1}
\overline{X}为样本均值,n为样本例数。

离散型方差
Var(X)=\sum_{i=1}^{n}p_i(x_i-\mu)^2=(\sum_{i=1}^{n}p_i\cdot x_i^2) - \mu^2,其中\mu=E(X)

连续性方差
Var(X)=\int_{-\infty}^{\infty}(x-\mu)^2f(x)dx=\int_{-\infty}^{\infty}x^2f(x)dx-\mu^2=E(X^2)-[E(X)]^2

性质:
(1)若c为常数,则Var(c)=0
(2)若X为随机变量,c为常数,则Var(cX)=c^2Var(X)
(3)若XY为两个随机变量,则Var(X \pm Y)=Var(X) + Var(Y)\pm 2Cov(X,Y)
其中协方差Cov(X,Y)=E[(X-E(X))(Y-E(Y))]
如果XY不相关,则Cov(X,Y)=0
(4)Var(aX \pm bY)=a^2Var(X) + b^2Var(Y)\pm 2abcov(X,Y)

协方差(Covariance)

定义
两个随机变量的协方差被定义为
Cov(X,Y)=E[(X-E(X))(Y-E(Y))]
方差是协方差的特例,即当X=Y时,Cov(X,Y)=Var(X)=Var(Y)

性质:
(1)线性组合的协方差
Cov(\sum_{i=1}^m a_i X_i,\sum_{j=1}^m b_j Y_j)=\sum_{i=1}^m\sum_{j=1}^n a_i b_j Cov(X_i ,Y_j)
两个随机变量特例:
Cov(aX+b,cY+d)=acCov(X,Y)
(2)独立随机变量的协方差
XY为独立的随机变量,则Cov(X,Y)=0

相关系数(Correlation coefficient)

定义
相关系数可以通过方差和协方差来定义。两个随机变量XY的相关系数定义为:
Corr(X,Y)=\frac{Cov(X,Y)}{\sqrt{Var(X)Var(Y)}}

性质:
(1)有界性
相关系数的取值范围为[-1,1],其可以看成是无量纲的协方差。
(2)统计意义
值越接近1,说明两个变量正相关性(线性)越强,越接近-1,说明负相关性越强,当为0时表示两个变量没有相关性。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容