从正态分布到T检验

1. 说明

 接上次的《几种常见的数学分布》。这次说说T分布和T检验,用词不够严谨,大家就领会精神为主吧~

2. 什么是抽样

 如果整体样本可以一个一个判断叫普查,如果整体样本太多,没法一个一个判断,只能取一部分代表整体,叫抽样。

 比如说,一个班有20个人,我们可以把所有人的身高加一起,除以人数,计算均值,如果有2000000人,就无法把所有人身高都统计一遍再除以总数,一般情况下,就是取其中一部分,计算其均值,认为他们能代表全部。

3. 正态分布

 先复习一下正态分布,比如说女人的身高一般在160左右,150, 170的比较少,140,180的更少,把身高当做横轴,人数作为纵轴画图,就可看到一个中间高两边低的钟形曲线,也就是正态分布。

 那什么不是正态分布呢?比如人的空腹血糖一般在4-6之间,而血糖高的7,8,9的很多,而低到3,2,1的就很少,不样一边多一边少的,就不是正态分布。

4. 正态分布和T分布

 如果只有20个人画一下算一下,就是正态分布;如果有2000000人,从中随机取出20个,画一图也就钟形,就叫T分布。它俩的不同就在于,一个是抽样的,一个是全体的。规律都是中间高两边低对称的样子。当取样趋于无穷大时,T分布就是正态分布,但一般都没法取太多。

5. 假设检验

 如果有2000000个女的,你认为她们的身高是正态分布,均值160(称理论值或标准值μ0),然后从中随机选了20个人,平均身高161(μ),标准差为5(上下浮动),那她们是否适合你所定义的正态分布均值160的规律呢?

 由样本信息对相应总体的特征进行推断称为统计推断。若对所估计的总体首先提出一个假设(平均身高160),然后通过样本数据(20个人)去推断是否拒绝这一假设,称为假设检验,如果符合这个假设就是H0(无效假设null hypothesis),如果不符合就是H1(备择假设alternative hypothesis)。

6. T检验

 以T分布为基础的检验叫T检验。这里主要是判断一组样本是否符合我们设定的“统计推断”。 将上例中的值代入公式,如果这20人的平均身高为161,求t值。

 如果这20人的平均身高为164



 可以看出t值的大小与抽样的均值161,标准差5,样本数20,以及统计推断160相关。

7. 如何查表

 H0成立时t服从自由度v=n-1=19的t分布,查表如下:

 上面的0.05和0.025又是什么呢?是p值(p-value),p=0.05意味着样本统计有95%的信心拒绝原假设,就是说p越小,原假设越可能被拒绝,一般p设成0.05,自由度19时,它对应的t值为2.093。

 当采样的20人平均身高为161时,t=0.894<2.093,即H0成立(抽样符合假设),当平均身高为164时,t=3.578>2.093,则H1成立(即这组抽样不符合假设)。

 就是说t差得越多,t是因为误差造成的可能性p越小,既然不是因为误差,那就是因为本质不同,所以不符合假设。

8. 单侧和双侧检验

 那上边为什么还有0.05和0.1的差别呢?它分别对应单侧和双侧检验。 理论值μ0(160),抽样均值μ(161)。

双测检验值:
μ≠μ0 (μ >μ0或μ<μ0)
单测检验值:
μ>μ0 (根据专业角度,μ不可能小于μ0)
μ<μ0 (根据专业角度,μ不可能大于μ0)

 通常我们用的都是双侧t检验,上例中用的也是双边的p值0.05对应的t值。

9. T检验的应用条件

 要符合t检验的条件,才能计算t检验的统计值

(1) 必须是随机样本且相互独立

 比如抽得出自一个家庭,就只能统计这一家的,不能代表全国的。

(2) 来自正态分布的总体

 正态分布是一种特殊的T分布,判断正态分布的方法有很多,比如Shapiro- Wilk (W检验)用于3-50个的小样本,Kolmogorov-Smirnov检验(D检验)用于小于5000的样本量,大于2000可做直方图,观察是否正态分布。

(3)方差齐性

 均数比较时,要求两总体方差相等

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,504评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,434评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,089评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,378评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,472评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,506评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,519评论 3 413
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,292评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,738评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,022评论 2 329
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,194评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,873评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,536评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,162评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,413评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,075评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,080评论 2 352