样本量估算及G*Power实现详细步骤(图文详解)
1.统计学基本概念
(1)假设检验、H0、H1
假设检验(hypothesis
test)又称显著性检验(significant test),我们进行研究的目的多是为了比较总体参数差异,但实际中能够获取的是样本统计量数据,样本数据间直接比较不能准确反应总体参数情况。样本统计量比较存在差异时,可能是总体参数差异引起的,也可能是样本的抽样误差引起的。假设检验中,引入原假设(null hypothesis)H0,和与H0完全对立的备择假设(alternative hypothesis)H1。
H0:总体参数无差异
H1:总体参数有差异
可以根据样本统计量的差值的数据类型、研究设计、推断目的,选择不同的检验统计量计算方法(t检验、z检验、F检验、卡方检验等),计算出得到该差值的概率P,
如果P≤α(预设的检验水准),可倾向于拒绝H0,倾向于接受H1;
如果P>α,则不足以拒绝H0,不足以接受H1。
(2)I类错误(α)、II类错误(β)
当H0成立,但因为样本的随机性,拒绝了H0,为I类错误,又称假阳性错误,检验水准α即为预先规定的允许犯I类错误的概率。
当H1成立,但因为样本的随机性,不拒绝H0,为II类错误,又称假阴性错误,用β表示(需要总体参数及样本含量才能计算出)。
正如红楼梦中所说,假作真时真亦假,其中假作真即为假阳性,I类错误;真亦假即为假阴性,II类错误。
当I类错误概率α约小,出现II类错误概率β越大,反之亦然。
增大样本量,可以同时减少α和β。
(3)检验效能
检验效能(power of a test),又称把握度,H1成立时正确拒绝H0的能力,用1-β表示。
把握度大小取决于四个方面:①两总体差异越大,1-β越大;②α越大,1-β越大;
③单侧检验比双侧检验大;④样本量越大,1-β越大。
(4)效应量
效应量(effect size),表示两总体分布的重叠程度,也就是自变量作用的大小。常见的效应量包括两总体均数的差值、两总体率的差值等。差值越大,表示两总体重叠程度越小,效应越明显。
(5)效应量与差异显著性、相关显著性的区别
差异显著性、相关显著性只是告诉我们,我们有1-α的把握认为,这差异、这相关系数是存在的,并不是完全由抽样误差造成的。但这代表差异、相关有实际的意义。尤其是大样本数据分析比较容易得到统计显著性的结果,但不意味着差异有意义。
效应量,表示的是自变量作用的大小。
(6)样本量
样本量(sample size),样本量过小,假设检验效能不够,无法显现出不同处理组间的差异,样本量过大,需要增加大量人力、物力的投入。
样本量大小受以下因素影响:①α越小,样本量越大;②β越小,样本量越大;
③总体间效应量越小,即两总体重叠约小,所需样本量越大
④总体变异性越大,所需样本量越大
2.G*Power 软件安装及软件介绍
(1)G*Power安装
下载地址(www.gpower.hhu.de)
解压缩文件夹后,双击setup,进行安装。
打开后可见如下主界面。
(2)G*Power介绍
G*Power是德国杜塞尔多夫大学开发的,专门用于计算统计功效及样本量的统计软件。该软件是完全免费的。软件可以计算t检验、F检验、χ2检验、z检验、Fisher检验等不同检验方法的样本量。
G*Power提供5种统计力分析类型:
3.G*Power计算样本量
S1:选择合适的统计方法
S2:选择5种统计力分析类型中的1种
S3:输入分析需要的参数,点击计算即可
(1)如下图,从Test family中选择t检验、F检验、χ2检验、z检验或Fisher检验。
从Statistical test中进一步选择分类
(2)G*Power中有5种统计力分析类型可选,计算样本量选择先验分析(priori)。
(3)下框中输入分析需要的参数,点击计算即可
4.实例演示-两独立样本均数比较的样本量计算
首先看第6版医学统计学人卫版课本P159例15-4,该例子使用公式计算出了需要的样本量。
使用G*Power,选择两组独立样本t检验,输入参数:双尾、d=δ/σ=2.76/1.70=1.62352941、α=0.05、1-β=0.9、N2/N1=1,点击计算得到N1=10,N2=10,(公式算出n1=n2=8)
使用G*Power,选择两组独立样本t检验,输入参数:双尾、d=δ/σ=2.76/1.70=1.62352941、α=0.05、1-β=0.9、N2/N1=2,点击计算得到N1=7,N2=15,(公式算出n1=6,n2=12)
可发现使用G*Power得到的样本量与使用公式得到的样本近似,但比公式结果略大。可能因为计算过程中精确度选择原因导致。