期望, 方差, 协方差,标准差

期望, 方差, 协方差,标准差

期望

概率论中描述一个随机事件中的随机变量的平均值的大小可以用数学期望这个概念,数学期望的定义是实验中可能的结果的概率乘以其结果的总和。

定义

P(x) 是一个离散概率分布,自变量的取值范围为{x_1,x_2,...,x_n}。其期望被定义为:

P(x)是一个连续概率密度函数,其期望为:

性质

期望服从线性性质,因此线性运算的期望等于期望的线性运算。
E(ax+by+c)=aE(x)+bE(y)+c

这个性质可以推广:


函数的期望:
离散


连续


但是,函数的期望不等于期望的函数,即E(f(x))≠f(E(x))

设C为常数: E(C)=C
设C为常数: E(CX)=CE(X)
加法:E(X+Y)=E(X)+E(Y)
当X和Y相互独立时E(XY)=E(X)E(Y)
(注意,X和Y的相互独立性可以通过下面的“协方差”描述)

意义

数学期望可以用于预测一个随机事件的平均预期情况。

方差

方差是在概率论和统计方差衡量随机变量或一组数据时的离散程度的度量,换句化说如果想知道一组数据之间的分散程度的话就可以使用方差来表示。

统计学方差

定义: 在统计描述中,方差用来计算每一个变量与总体均值之间的差异。为避免出现离均差总和为0, 离均差平均和受样本含量的影响。统计学采用平均离均差平方来描述变量的变异程度。意思应该就是为了避免有的数据和均值的差值是正数,有的是负数,他们相加会相互抵消,所以用平方的形式来衡量。

公式

其中σ2为总体方差, X为变量, μ为整体均值,N为总体例数。

样本方差

由于在实际环境中没有办法穷举所有例子, 所以只能找出部分样本数据,基于这部分样本进行测算。可以把公式转换为:


其中S2为样本的方差,μ为采集样本的均值, n为样本的个数.

概率论方差

在概率论中, 设X是一个离散型随机变量。

  1. 定义: 在概率分布中, 设X是一个离散型的随机变量,若E((X−E(X))^2))存在,则称它为X的方差,记为D(X),Var(X). 其中E(X)X的期望,X是变量值。
  2. 离散型随机变量方差计算公式:
    D(X)=E((X−E(X))^2)=E(X^2)−(E(X))^2
  3. 连续型变量X, 其定义域(a, b),概率密度函数为f(x), 连续型随机变量X方差计算公式:
    D(X)=∫^b_a(x−μ)^2f(x)

    标准差(Standard Deviation)

    定义
    又叫均方差, 是离均差平方的算数平方根。标准差能体现一个数据集的离散程度,平均数相同的两组数,标准差未必相同。
公式
标准差的意义

标准差和方差都是用来衡量样本离散程度的量,那么为什么要有标准差呢? 因为方差和样本的量纲不一样。换句话说不在一个层次,怎么理解这个层次,从公式来看方差是样本和均值的平方和的平均。这里有一个平方运算,这是导致量纲不在一个层次的原因。而标准差和均值的量纲(单位)是一致的,在描述一个波动范围时标准差比方差更方便。

协方差(Covariance)

方差/ 标准差描述的是一维数据集合的离散程度, 但世界上现象普遍是多维数据描述的,那么很自然就会想到现象和数据的相关程度,以及各维度间相关程度。
比如,一个产品卖的好不好有很多因素构成,比如产品质量,价格等。那么价格质量之间是否由相关性呢?这个问题就可以用协方差来解决。

公式

期望值分别为E(X), E(Y)的两个变量X,Y的协方差
Conv(X,Y)=E[(X−E(X))(Y−E(Y))]
=E(XY)−2E(X)E(Y)+E(X)E(Y)Y)
=E(X)
协方差表示两个变量的总体的误差。这和只表示一个变量误差的方差不同。如果两个变量变化的趋势一致,也就是说如果其中一个大于自身的期望值,另外一个也大于自身期望值。那么两个变量之间的协方差就是正。如果两个变量的变化趋势相反,即其中一个大于自身的期望值,另外一个小于自身期望值,那么这两个变量之间的协方差就是负值。如果X,Y之间是独立的,那么两者的协方差就是0

协方差性质



同一个变量的协方差等于其方差Con(X, X) = Var(X)
Con(aX, bY) = abCon(X, Y) a, b 为常量
Con(X1 + X2, Y) = Con(X1, y) + Con(X2, y)

相关系数

协方差作为描述X和Y相关程度的量,在同一物理量纲下有一定作用。但同样的两个量采用不同的量纲使他们的协方差在数值上表现很大的差异,故引入如下概念:


相关关系

相关性是一个衡量线性独立的无量纲数, 其取值在[ -1, 1] 之间。
相关性 corr = 1 时称完全线性相关。
相关性 corr = -1 时称完全线性负相关。
相关性 corr = 0 时称不相关。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,204评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,091评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,548评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,657评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,689评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,554评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,302评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,216评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,661评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,851评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,977评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,697评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,306评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,898评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,019评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,138评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,927评论 2 355