之前我们介绍了t检验的基本思想-t分布,知道了t分布的含义,那接下来我们就要知道t检验是干嘛的,使用t检验的前提条件是什么。
一、t检验是干嘛的?
t检验是用于比较两个样本均值差异的检验方法,它是用t分布理论推断差异发生的概率,从而判定两个平均数的差异是否显著。
举个栗子,假如我是一个工厂的老板,工厂到了一批新机器,用于生产之前的产品,此时我想知道新机器生产的产品质量是否超过原先的老机器,如果质量差不多,那我就买亏了;质量高才正常,如果质量还不如原先的,那我就是被骗了,血亏。
此时,在生产之前,我先生产一小部分,看看这小部分质量如何,如果好那就可以大范围生产,不然如果我对质量不满意,我得赶紧退货,不然损失太大。现在,摆在我面前有两种方法:
1、将这一小部分的产品质量加起来,求平均值,再和之前的产品质量的均值比较,质量好不好一目了然。
2、采用t检验,通过统计学计算,得出质量是否合格。
第一种方法看着没问题,但懂点统计学基础的人肯定知道这是不可以的,因为你选择的是目前生产的一部分,难道之后生产的完全和这一部分是一样的么?机器不会出一点问题?员工操作也不会出一点问题?
这就引入了抽样误差这一概念
我们为了避免因为质量不理想而大规模生产造成损失,只选择一部分进行测量,这就已经是抽样了,既然是抽样,那就避不开抽样误差。如果选30个产品进行检测,我生产10次,每次30个,检测的话,每次30个产品的质量平均数肯定都不一样,有超过原先的,也有差不多的,甚至有低于原先的。
既然有批次产品质量会有问题,那我怎么能避免呢?我如果运气差,恰好就抽到那批质量不好的作为检测标准,本来有可能是小概率事件,机器没问题,但却误导了我,把新机器退了,那样我将会支付大量的违约金。
t检验的产生应运而生,t检验正好就可以解决这样的问题。
如果我生产成千上万的产品,最后再看产品的质量,如果达标那就通过,继续生产赚钱;如果不达标则不通过,运气好点和之前的质量一样可以继续使用,如果低于原先的质量,我将血亏,就算退货,我也得承担此次生产的成本。既然我们没法通过大量产品得到结果,那就通过小样本来推断总体是否达标,只要统计学上过关,那之后发生错误的风险就会很低。
不可能没有风险,因为这个结论仅仅是统计学上下的结论,是一种概率性的结论,即使出错的概率很低,但不代表不出错。
二、t检验原理
想要了解t检验原理,首先要了解什么是假设检验。此处我先简单说一下,之后会专门出一篇介绍假设检验的原理。
假设检验是一种根据样本数据来推断总体分布或者均值、方差等总体统计参数的方法。
之所以要用样本来估计总体,是因为总体数据很难全部得到,或者说成本太大,比如全国中学生的身高。
假设检验最基本思想:小概率事件不会发生,如某件事发生的概率小于5%,这事不可能发生了,因为在统计学上默认<5%=不可能。
此时我们来讲t检验的原理
1、建立假设
(1)原假设或无效假设:H0: μ=μ0,即两总体均数相同。 (新机器产品质量=旧机器产品质量)
(2)备择假设或有统计学意义假设:H1:μ≠μ0,即两总体均数不同。(新机器产品质量≠旧机器产品质量,是高是低我不知道),根据专业知识及数据特征,备择假设H1也有单侧形式:μ<μ0,μ>μ0。
◆ 选择双侧检验,还是单侧检验需依据数据特征和专业知识进行确定;
◆ 原假设不是随意而为,一般套路是朝着预期目标相反的方向做假设,例如,预期两均值差异明显,那么原假设就是两均值相同(无差异);
◆ 原假设两总体均值相同,这件事发生的概率P如果小于5%,那么是很罕见的,可以认为是偶然发生的,在统计学上认为这种小概率事件是不可能发生的。
2、计算T统计量及概率P值
在总体方差未知情况下,进行两均数的比较用t检验,在原假设的基础上,按照固定的公式计算T统计量。
◆ t检验中的t统计量一定是服从t分布;
◆ t统计量的计算公式(前为单样本t检验,后为独立样本t检验)
◆P值是用来拒绝原假设H0的概率,与显著性水平进行比较;
3、推断决策(两个假设二选一)
根据计算的T检验统计量,确定相伴概率P值,如果P落入拒绝域,即P<0.05那么就可认为前面做出的【原假设】这件事是不可能发生的,从而备择假设才是正确的。
◆ t检验结果解读的一般套路:P<0.05,则说明两组样本所代表的总体均 值差异显著;(我的新机器产品质量和旧机器产品质量不一样,此时再看如果这30个新机器的产品质量的平均值是>旧机器产品质量平均值的,那就可以下我的新机器产品质量>旧机器产品质量这一结论;如果这30个产品质量<旧机器,那就赶紧退货,并完全可以因为虚假宣传要求赔偿。)
◆ 当P>0.05时,原假设的事件不是小概率事件,没有理由拒绝原假设,即两个均值一致,没有差异。(此时,我买的新机器和旧机器差别不大,赶紧退货止损)
三、双侧or单侧?
双侧T检验:◆ 用户仅知道预期目标是两组样本均值理论上有差异,但不知道是小于还是大于;
◆ 原假设:μ1=μ2,备择假设:μ1≠μ2(用的是不等于号)
单侧T检验:
◆ 用户知道事情发生的方向,如苗木高度超过1.6米即可出圃,即用户知道预期目标有差异,而且是>1.6米;
◆ 原假设:μ1=μ2,备择假设:μ1>μ2或者:μ1<μ2(小于或者大于·号)
再次强调假设不是用户随意指定的,t检验假设套路是:备择假设是你预期希望发生的方向,而原假设则是朝着与预期要发生的相反的方向假设。比如A和B两种治疗方法疗效是否有差异,我们预期目标是二者差异 显著,那么备择假设即“有差异”,原假设即“无差异”。
利用SPSS软件进行t检验,软件默认输出的是双侧概率p值,因此如果我们的研究是单侧问题,那么请对该p除以2作为单侧t检验的概率值。
四、t检验的适用条件
t检验最基本的条件是样本数据来自正态分布总体,或近似正态分布总体,简单理解就是样本数据必须具备正态性,符合正态分布。
两组独立样本数据间的方差相等或一致,统计学上称之为“方差齐次”。
具体每一个t检验所要求的适用条件稍微有点区别,我会在具体的篇章中单独介绍,此处不赘述。
本篇介绍完毕,接下来我会逐个介绍每一个t检验的具体用法和使用场景,拜拜。