统计测量任务八
名词解释
1.随机模型:研究中自变量(因素)水平(又称实验处理)是随机取样,所选各水平仅是无限多个水平中的一部分有代表性的样本。
2.固定模型:研究中自变量(因素)总体是有限的几个固定值。所选的实验处理水平即为处理水平的总体。
3.组间设计:即每个(或每组)被试只接受一种自变量水平的实验处理,不同被试接受不同的自变量水平实验处理。
4.组内设计:指每个或每组被试接受所有自变量水平的实验处理的真实验设计,又称“重复测量设计”。这时,每个被试组接受所有实验处理,但组中每个被试只随机地接受一种实验处理。
简答
一、什么是二项分布?其平均数与标准差的意义有哪些?推论统计-数据分布
答:1)二项分布的定义:二项分布是指试验仅有两种不同性质结果的概率分布,即各个变量都可归为两个不同性质中的一个,两个观测值是对立的,即二项分布是两个对立事件的概率分布。二项分布的具体定义是:有n次彼此独立的试验,每次试验某事件(或成功事件)出现的概率为p,某事件(或失败事件)不出现的概率为q(=1-p)。
2)二项分布的平均数与标准差意义
如果二项分布满足p<q,np>=5(或p>q,nq>=5)时,n被认为很大,二项分布接近正态分布。此时X变量(即成功的次数)为μ=np, σ=√npq的正态分布,其平均数和标准差是根据理论推导而来,故用μ和σ表示。含义是在二项试验中,成功次数的平均数μ=np,成功次数的离散程度σ=√npq。在实际试验中,试验次数越多,成功次数的平均数和分散程度越接近理论值μ和σ。二项分布应用于解决含有机遇性质的问题(区分实验结果是否由猜测造成的)
二、何谓样本平均数的分布?推论统计-数据分布(20190331)
答:1)从正态分布的总体中可无限抽取所有可能的特定容量(大小为n)的随机样本,所计算的这无限多个样本平均数的分布叫样本平均数的分布。
2)按样本平均数分布规律进行推断与解释:当总体分布为正态或近似正态分布,总体方差已知,样本平均数分布为正态分布,统计量服从正态分布,对样本平均数的分布按正态分布解释;当总体为正态或接近正态,但总体方差未知,用样本的方差代替总体的方差,统计量服从自由度为n-1的t分布,对样本平均数的分布按t分布解释。
三、何谓点估计与区间估计,它们各有哪些优缺点? 推论统计-参数估计(点估计、区间估计)
答:1)区间估计是指用数轴上一段距离,表示未知参数可能落入的范围。点估计是当总体参数不清楚时,用一个特定值(一般用样本统计量)对其估计。
2)点估计的优点是能够提供总体参数的估计值,缺点是点估计总以误差的存在为前提,且不能提供正确估计的概率。区间估计的优点是不仅给出一个估计的范围,还能给出估计精度并用概率说明估计结果的有把握程度,缺点是不能确定一个具体的估计值。
四、优良点估计应满足什么条件?推论统计-参数估计(点估计)
答:1)无偏性:所有可能的统计量与参数真值的偏差的平均值为零。
2)一致性:当样本容量无限增大时,估计值会越来越接近它所估计的总体参数。
3)有效性:若一个无偏估计量的方差对于其他无偏估计量的方差来说是最小的,那么它的取值是比较稳定的,则这一估计值是有效的。
4)充分性:用作估计值的统计量能够反映样本全部数据所反映的总体的信息。
五、说明下列各项因素如何影响置信区间的宽度:推论统计-参数估计(区间估计)
(1)增加样本量,(2)增加样本的变异性,(3)提高置信度。
答:1)样本量对置信区间的影响:在置信水平固定的情况下,样本量越多,置信区间越窄。
2)置信水平对置信区间的影响:在样本量相同的情况下,置信水平越高,置信区间越宽。
3)增加样本的变异性与置信区间的影响:变异越大,说明样本之间的差异越大,置信区间越宽。
六、简述假设检验的基本过程。推论统计-假设检验
答:1)根据问题要求,提出虚无假设H0和研究假设H1
2)选择适当的检验统计量根据抽样分布的原理。
3)计算检验统计量根据样本资料计算出检验统计量的具体值。
4)规定显著性水平,并根据检验的类型查出临界值根据显著性水平和检验类型,通过统计量分布表查出临界值,即拒绝域也随之确定。
5)比较临界值与统计值并进行决策:用计算出的统计量的具体值与临界值相比较,依据检验统计量是否落在拒绝域中,做出接受或拒绝虚无假设的决策。如临界值大于统计值,则接受H0,拒绝H1;反之,则拒绝H0,接受H1。
论述
一、什么情况下适合用非参数方法进行平均数差异的显著性检验?推论统计-假设检验
答:1)非参数检验一般不需要严格的前提假设,对总体分布不做严格假定,对样本分布没有要求。当两总体为非正态分布或分布形态未知时适合用非参数方法进行平均数差异的显著性检验。
2)非参数检验特别适用于顺序类型的数据(等级变量)甚至称名数据。
3)非参数检验很适用于小样本,且方法简单。心理学研究中一些规模较大的实验,常常需要在正式实验前做一些实验,要求被试较少且结果尽快处理,用非参数方法很方便。
4)非参数方法最大不足是未能充分利用资料的全部信息。目前还不能处理“交互作用”。
5)采用非参数检验进行平均数差异的显著性检查的方法有:独立样本的秩和检验法、中数检验法,相关样本的符号检验法和符号秩次法(符号秩和检验法)。
二、参数检验(如t或ANOVA)与非参数检验(如卡方)主要差异在于它们要求的假定和需要的数据。解释这些差异。推论统计-假设检验
答:1)参数检验是当总体分布已知,对总体的未知参数进行假设检验。如已知总体为正态分布,可进一步知道样本均值和方差有关总体均值和方差的充分统计量;非参数检验是当总体分布未知,或相关信息所知甚少,对未知分布函数的形式及其他特征进行假设检验。
2)参数检验需要有一些严格的假设,一方面以明确或假定总体分布为前提,对总体未知参数进行估计或检验;一方面需要满足某些总体参数的假定条件。若不满足这些假设仍然用参数方法处理,很有可能得出错误结论;非参数检验一般不需要对总体分布做严格的前提假设。
3)参数检验适用于等距或等比数据的检验;非参数检验适合于计量信息较弱的资料,依据数据的顺序、等级资料即可进行统计推断,因此特别适用于顺序数据(等级变量)甚至称名数据。
4)非参数统计中与参数统计中使用的统计量不同。由于非参数模型,在提炼样本信息时,不可能将样本压缩得十分紧凑而不损失信息。另外统计量的分布或至少是极限分布的,应该与总体分布无关。(此条为原答案,个人认为与原题无关)
三、试述方差分析的基本原理及步骤(举例说明)。复杂统计分析-方差分析
答:方差分析为两个或两个以上的平均数差异的显著性检验,以单因素方差分析为例来说明方差分析的基本原理及步骤。
1)方差分析的基本原理:
1.1)综合虚无假设与部分虚无假设:将“样本所归属的所有总体的平均数都相等”的虚无假设称为“综合虚无假设”,组间的虚无假设称为“部分虚无假设”
1.2)方差的可分解性:即方差的可加性。方差分析将实验数据的总变异分解为若干不同来源的分量,就是将总平方和分解为几个不同来源的平方和。变异来源:总变异SSt为实验中产生的总变异,组间变异SSb为不同实验处理造成的变异,组内变异SSw为实验误差造成的变异。SSt=SSb+SSw
2)方差分析的基本步骤:
1)求平方和
平方和为观测数据与平均数离差的平方总和。根据原始数据,分别计算总平方和SSt、组间平方和SSb与组内平方和SSw
2)计算自由度
分别计算总自由度DFt、组间自由度DFb与组内自由度DFw
DFb =k-1 DFw=k(n-1) DFt=DFb+DFt=nk-1
3)计算均方(方差)
分别计算组间均方和组内均方。均方=平方和/自由度 MS=SS/DF
MSb=SSb/DFbMSw=SSw/DFw
4)计算F值(效应模型与F检验)
根据不同的效应模型,选择相应的公式计算F值。F=组间均方/组内均方=MSb/MSw
5)查F值表进行F检验并做出决断
查F值表,根据F检验确定二者差异是否达到显著性水平,做出接受或拒绝虚无假设的决断。如果计算的F值大于显著性水平的临界值,则可拒绝H0,即可以得出不同组平均数之间在统计上至少有一对存在显著差异。(方差分析结果存在显著差异,则须进行事后检验。即利用事后多重比较方法可进一步判断出是哪一对或哪几对存在显著差异)。
6)陈列方差分析表
将以上步骤计算结果归纳成方差分析表,列于实验报告结尾。主要包括变异来源、平方和、自由度、均方、F值和P值。