推断统计(2) - 抽样理论

推断性统计学是用样本(历史数据)的估计量(离散型或连续型)推断总体(将来)的对应的参数值(离散型或连续型)。推断性统计学有概率理论、抽样理论、估计理论和假设检验理论四个理论组成部分,其中抽样理论由抽样设计抽样分布两部分组成。

抽样设计

从总体中抽取合适样本的方法,使得由样本到总体的推断是合理的,这一过程称为抽样设计,即对一个存在的测量总体,制定一种从中抽取测量样本的方法。抽样方法必须满足独立性与随机性。
根据抽样总体的不同,抽样情形可以分为对无限大总体抽样对有限总体有放回抽样以及对有限总体无放回抽样。其中对有限总体无放回抽样的容量N相对于样本容量n小的时候(n>0.05N),认为该抽样违反了独立性。
抽样设计方式分为简单随机抽样设计分层随机抽样设计系统随机抽样设计以及整群随机抽样设计四种。

抽样分布

如果从某个总体中取出容量为n的样本,可以获得一套关于这n个样本的一套统计量,当这个过程重复k次,可以获得k套统计量,这些样本统计量从而形成了某种概率分布,这些统计量形成的频数(概率)分布就称为抽样分布。常用的抽样分布有:近似正态分布、t分布、卡方分布、F分布。

样本均值

均值的理论抽样分布:有总体N,每次从中抽取固定容量为n的样本并计算该样本的均值,如果将所有可能 抽取的样本列出并计算均值,这些均值的频率分布则被称为理论抽样分布。
均值的经验抽样分布:在抽样计算均值的过程中没有抽取所有可能的样本计算均值,则被称为经验抽样分布。随着样本个数主键趋近‘所有可能的样本’,经验抽样分布逐渐趋近理论抽样分布。

中心极限定理:对无限大总体抽样、有限总体有放回抽样以及有限总体无放回抽样(总体容量N>=2*样本数量n),如果n足够大(总体正态或近似正态,n>20/25;总体未知,n>=30),均值的理论抽样分布近似服从正态分布。即虽然很多总体的分布并不是正态分布,但是大样本统计量一般符合正态分布,该现象被称为中心极限定理。

Z-分布:服从正态分布的均值抽样分布转换为标准正态分布称为Z-分布。Z-分布适用于正态分布总体抽样或样本容量大于30的抽样,能够通过样本信息推断总体均值。

t-分布:从正态分布总体中抽取数量为n的样本,总体中的随机变量T对应在样本中的值t形成的抽样分布称为t分布。t分布的核心是描述了小样本情况下的样本统计量的分布。t分布是一个分布族,每个整数自由度对应一个分布:当自由度无限时,t分布就是标准正态分布;随着自由度减小,曲线越发平坦,当自由度小于30时,t分布与标准分布相差较大。因此,在实际情况中,当总体数量较大,而抽样数量在30以内就可以用t分布替代正态分布描述抽样分布,但是t分布在大量样本抽样也是可用的。t分布最常用的情况是假设检验的t检验,分为单样本检测和双样本检测,模式都比较固定。

切比雪夫(Chebyshev)定理:给定一组数据x1,x2,…,xn,其均值假定为μ,标准差σ>0,则对任意k≥1,位于区间[μ-kσ,μ+kσ]内的数据所占比例大于等于1-1/k2。在总体分布未知(或非正态)且样本容量较小(n<30)时,可以采用切比雪夫定理近似估计总体均值。

样本方差

卡方分布

卡方值计算
卡方统计量(表明样本方差与总体方差的比值关系)决定的抽样分布称为卡方分布。卡方分布描述了取自正态总体的n个样本的卡方值的分布。卡方分布是一个概率分布族,对每一个自由度都有一个具体的卡方分布与其对应。低自由度的卡方分布曲线是不对称的,长尾拖在右边(右偏)。随着自由度的增加,卡方分布逐渐变成单峰,且越来越对称,但并不是关于0对称,而是关于自由度对称,这些特性与Z分布和T分布有很大不同。卡方分布能够用于样本方差到总体方差的推断性分析。除此之外,卡方分布还能用于非参数检验,称为卡方检验,不过卡方 检验的卡方统计量公式与上面卡方统计量公式是不一样的。

F分布

F值计算

F统计量其实可以认为是由两个卡方统计量相除得到的,因此F分布也被称为方差比分布。F分布也是一个概率分布族,由分子和分母的两个自由度决定一个F分布曲线.,随着分子和分母自由度的增加,F分布的分布曲线也越来越对称,且对称的中点为1。F分布处理的则是两个总体之间的关系,即通过两个样本之间的关系推导出两个总体之间的关系。F分布能够用于推断两个总体方差之间的比值关系;除此之外,F分布还是后面将要介绍的方差分析的理论基础

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,406评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,732评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,711评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,380评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,432评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,301评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,145评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,008评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,443评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,649评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,795评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,501评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,119评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,731评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,865评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,899评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,724评论 2 354

推荐阅读更多精彩内容