为了学统计同时看了《行为科学统计》、《行为统计学基础》、《商务与经济统计》、《深入浅出统计学》。都是好书,但推荐前两本。第三本对公式和过程解释得不是特别简单,最后的不够系统,但是对核心概念解释得比较好,我是拿来参考不懂的概念的。本文以《行为科学统计》为主进行梳理,主要是围绕假设检验以及检验方法。更基础的概念下一篇梳理。
支撑推断统计的学科是概率论(很重要!!),因此结论都是一定概率范围内的。
假设检验
含义
我的理解:
从一个总体中抽出许多个大小为 n 的样本,样本均值基本遵从正态分布(中心极限定理),定义 α 的概率为显著性水平,则认为大部分的抽样均值(比例为 1-α)在零假设(H0)定义的范围之内。而若某次抽样(实验抽样)均值出现在 α 对应的数值范围内,则与我的判断不符,拒绝 H0。
(α代表范围、分布概率,z代表距离)
这部分很重要,理解了就理解了统计学的核心思想。下面的各种方法都是基于这个概念。
《行为科学统计》的解释:
关键概念:
- z-score:表示每一个数值(X值)在总体分布中的位置,即距离总体平均数多少个标准差。
中心极限定理:
对于任意平均数为 υ,标准差为 σ 的总体,样本大小为 n 的样本平均数分布具有平均数 υ,标准差 σ/√n(这货是根号),并且当 n 趋于无穷时,分布将趋于正态。-
样本均值的标准误差
M表示样本分布平均数(注释见最后),则M的标准误= σM= σ/√n(公式见p178)
样本平均数的 z-score: 表示从总体中多次抽样的到的多个样本均值 M 的分布,M 在此分布上的位置
标准误≠取样误差(因为它表示样本均值分布的离散度(距离平均值也是总体均值υ),而不是每次取样有可能产生的误差)
也可看作:样本与总体的差异/偶然误差
均值置信区间
两类错误
第一类错误:拒绝 H0 而 H0 为真,错误概率为α
第二类错误:不拒绝 H0 而 H0 为假,错误概率为贝塔-
显著性水平:统计上的显著水平
- 表示了经处理后的样本和总体有显著差异,但不代表处理效应多大,只代表是否有效。
- 不一定是实质上的显著。因为它表示处理效应大于随机效应,随机性由标准误测得,当样本很大时,小的处理效应也可以是显著的。
-
处理效应 科恩d
科恩 d 值=平均数差/标准差= (M-υ)/σ
步骤
- 声明 H0
- 声明 H1
- 确定合适的统计量
- 确定显著性水平
- 判别合适的抽样分布
- 确定拒绝H0的区域
- 总结和分析数据
统计方法
平均数检验:单样本
z 检验(总体方差已知)
z=(M-υ)/σM= (M-υ)/σ/√n
置信区间 υ=M±zσM
置信区间:已知α水平,可根据α/2求得标准正态分布(均值0,标准差1)的 z-score,(因为求区间,因此取α/2),再根据上面的公式求得置信区间。
t 检验(总体方差未知)
大多数情况下总体参数未知。xxx统计学家以 student 的化名发表了 t 分布。用样本方差估计总体方差。
-
公式
公式中的分母 sM 是一个估计的标准误,用估计的标准差 s 替代总体标准差 σ
s 如何计算呢?
总体方差 σ 平方=SS/n, SS=(总体每一数值-总体均值)的平方和,即总体数值与均值离差的平方和。
如下图是样本数值与均值的离差的平方和。它小于总体数值与均值离差的平方和。(因为总体的外延更大,会有极值没包含在样本内)
那么由于样本方差的分子小于总体方差的分子,在用样本数值估计总体方差时,改小分母,使估计精确。
因此用样本数值估计总体时,估计总体方差=s 平方=SS/n-1=SS/df
自由度:df=n-1
自由度:若一个数列15个数,平均数 u, 那么14个数可自由取值,由于均值确定,第15个数可得出,它是不自由的。因此自由度 n-1t 分布的形态:接近于正态分布,样本越大,越接近正态分布
图根据自由度、α值可得期望 t 值
置信区间(下述)
-
处理效应
- 科恩d值
估计的d值=平均数差/估计总体标准差=(M-υ)/sM -
r平方
- 科恩d值
-
根本假设
- 样本中的数值都是独立观测的
- 样本来自的总体必须是正态分布(n很大时,误差不大)
平均数检验:双样本
独立样本检验
独立样本研究两个完全独立的样本。重复样本对同一样本使用不同的处理。
- 典型实验
研究两种教学方法的差异,一组同学使用方法一,另一组同学使用方法二。 -
公式
公式表示用样本均值的差异来评估总体均值的差异
分母计算:
分母 sp平方(合并方差)用两个样本平均方差来表示每个样本的方差
- 自由度=df1+df2=n1+n2-2
- 处理效应
-
科恩估计d=平均数差/标准差
- r 方,同单样本检验
-
- 根本假设
- 每个样本中的观察都必须是独立的
- 两总体都必须是正态分布,但样本量大时关系不大
- 两总体方差相等
- 方差齐性检验:Hartley 检验
公式中的合并方差是两总体方差的均值,如果两总体方差不等,则这个值失去意义。
思路是:假设两总体方差相等,那么样本方差也近似。-
公式:
- k=独立的样本的个数(独立样本 t 检验中 k=2)
- df=n-1 对于每个样本来说,自由度为 n-1 ( 如果两个样本样本数不同呢?)
- 求值:在α,k, df, 已知时 可求的 Fmax 临界值,如果观测值大于临界值,则齐性假设无根据,小于则总体方差相等。(等于?)
- 若方差不等,可以进行方差修正 《基础》306
-
- 检验一般步骤(待补充)
重复样本检验
典型实验
对一组同学先使用某种教学方法测验,再用另一种方法,看哪种方法测验结果更好。缺点和解决
时间因素和顺序效应:两次测试在时间上不同,变化可能是由时间引起;由于顺序问题,第2次测验可能疲惫(例如教学方法类测验)
解决:尽量抵消平衡。例如对于教学方法一二的测试。第1组被试先一后二,第二组先二后一。-
公式
通过计算每个被试两次测验的差值,以这个差值作为样本数值,求均值并与总体均值比较。可看作单样本检验。
D 表示差值,sMD=独立样本检验的公式
- 效应大小
- 科恩估计d=样本差值平均数/样本标准差=MD/s
- r 平方,同单样本检验
- 检验一般步骤(待补充)
t 检验中 总体均值的置信区间:
平均数检验:多样本 方差分析
和t检验的区别:
- 可以测量多因素
- 可以既有因素,又有因素的 level
- 可以同时进行独立测量和重复测量
例如两组被试,每一组用不同的治疗方法(独立),每一组都在3个时间点测量(重复)
单因素:独立测量
- 典型实验:对3组样本,测量3种温度条件对学习成绩的影响
公式:F=组间方差/组内方差=MS间/MS内
MS间=SS间/df间 MS内=SS内/df内
MS 表示均方,理解为方差公式含义:处理效应引起的效应+个体差异和偶然误差/个体差异和偶然引起的效应
处理效应是否比偶然引起的效应大-
公式计算:
组内方差=每组各自SS和/每组各自df和 (合并方差)
组间方差=SS总-每组各自SS和/组间df
总方差=SS总/df总
df总=N-1 N=各样本数总和
df组内=n1+n2+n3-k=N-k k表示处理条件或因素水平的个数 在这个典型实验里 k=3
df组间=k-1=df总-df组内 -
F分布: 起始为0,趋近于1的有偏分布。越靠右概率越小。
显著性检验:已知α和分子分母的自由度,可算出F期望。若F观测大于他,则拒绝H0
-
处理效应
方差分析中用η平方表示
-
事后检验:检测到底哪些处理效果起作用
-
Tukey 检验
公式
几个样本大小(n)必须一样
已知k, df内,α,查表得 q
HSD表示差异显著时所得值,可比较每组样本均值差是否大于HSD Scheffe 检验
最安全的事后检验
-
-
检验一般步骤
- 声明 H0
- 声明 H1
- 确定合适的统计量
- 确定显著性水平
- 判别合适的抽样分布(若n>30,误差不大)
- 确定拒绝H0的区域
- 计算总、组间、组内分别3个 SS 和 df -> MS组间、组内 -> F 值
- 若F显著,Hartley 检验方差齐性
- 方差齐性检验显著/不显著,先修正F,检验处理效应r方?
- Tukey 事后检验
根本假设同 t 检验 两个处理时 F=t方
单因素:重复测量
- 典型实验:测试不同分散注意力的情况对视觉任务的影响。对n个被试,要求在没有干扰、视觉干扰(闪光)、听觉干扰(噪音)时找出图片错误。考量3组处理,以处理为维度。
-
原理:
-
计算公式:F处理间/F误差 =处理效应+偶然误差
(没有个体差异)/偶然误差(没有个体差异)
SS被试间
Df被试间=n-1(n=被试数)
- F 计算步骤
- 计算总、处理间、处理内分别3个 SS 和 df
- 计算F分母各成分,算出SS被试间 -> SS误差=SS处理内-SS被试间 df误差=df处理内-df被试间
- 计算分子分母 MS处理间=SS处理间/df处理间 MS误差=SS误差/df误差
-
处理效应
Tukey /Scheffe 事后检验
同单因素,MS误差替代 MS处理内,df误差替代 df处理内-
根本假定
- 每个处理条件里的观察必须是独立的
- 每个处理内的总体分布必须是正态分布,但样本量大时关系不大
- 每个处理的总体总体分布的方差是大体相当的
- 协方差齐性,每个被试在每个处理条件中都保持一定的相对位置
检验一般步骤
双因素/多因素
-
适用场景:考虑最简单的情况
- 双因素
- 只适用独立测量
- 样本大小相同
典型实验:3种温度和2种湿度对学习的影响,6种情况每种5个被试。
-
原理:
公式
FA=因素A方差均数/偶然误差
FB=因素B方差均数/偶然误差
FAB=不能用主效应解释的方差/偶然误差-
计算步骤
- 计算总、处理间、处理内分别3个 SS 和 df
典型实验里,df总=30-1 df处理间=6-1 df处理内=5*6-6 - 计算因素A、B、交互作用AB分别3个 SS 和 df
dfA=A对应的行或列数-1 dfB同理 SSAB=SS处理间-SSA-SSB dfAB=df处理间-dfA-dfB - 计算MS处理内、MSA、MSB、MSAB
- 计算FA=MSA/MS处理内 FB=MSB/MS处理内 FAB=MSAB/MS处理内
- 计算总、处理间、处理内分别3个 SS 和 df
-
处理效应
因素A 同 B 的公式
事后检验?
根本假定:同单因素独立测量检验=t检验
检验一般步骤
相关(待补充)
附:统计学符号表
υ
σ
M: 代表样本分布平均数,理解为单次抽样的样本均值。一个总体的许多个样本,每个样本的平均数是一个M值。