不学统计，不谈逻辑 |《行为科学统计》

为了学统计同时看了《行为科学统计》、《行为统计学基础》、《商务与经济统计》、《深入浅出统计学》。都是好书，但推荐前两本。第三本对公式和过程解释得不是特别简单，最后的不够系统，但是对核心概念解释得比较好，我是拿来参考不懂的概念的。本文以《行为科学统计》为主进行梳理，主要是围绕假设检验以及检验方法。更基础的概念下一篇梳理。

图片发自简书App

支撑推断统计的学科是概率论（很重要！！），因此结论都是一定概率范围内的。

假设检验

含义

我的理解：
从一个总体中抽出许多个大小为 n 的样本，样本均值基本遵从正态分布（中心极限定理），定义 α 的概率为显著性水平，则认为大部分的抽样均值（比例为 1-α）在零假设（H0)定义的范围之内。而若某次抽样（实验抽样）均值出现在 α 对应的数值范围内，则与我的判断不符，拒绝 H0。
（α代表范围、分布概率，z代表距离）

这部分很重要，理解了就理解了统计学的核心思想。下面的各种方法都是基于这个概念。

《行为科学统计》的解释：

假设检验图.png

关键概念：

z-score：表示每一个数值（X值）在总体分布中的位置，即距离总体平均数多少个标准差。

z-score 公式.png

中心极限定理：
对于任意平均数为 υ，标准差为 σ 的总体，样本大小为 n 的样本平均数分布具有平均数 υ，标准差 σ／√n（这货是根号），并且当 n 趋于无穷时，分布将趋于正态。
样本均值的标准误差
M表示样本分布平均数(注释见最后)，则M的标准误= σM= σ／√n(公式见p178)
样本平均数的 z-score: 表示从总体中多次抽样的到的多个样本均值 M 的分布，M 在此分布上的位置
标准误≠取样误差（因为它表示样本均值分布的离散度（距离平均值也是总体均值υ），而不是每次取样有可能产生的误差）
也可看作：样本与总体的差异／偶然误差

样本均值分布的 z-score.png
均值置信区间
两类错误
第一类错误：拒绝 H0 而 H0 为真，错误概率为α
第二类错误：不拒绝 H0 而 H0 为假，错误概率为贝塔
显著性水平：统计上的显著水平
- 表示了经处理后的样本和总体有显著差异，但不代表处理效应多大，只代表是否有效。
- 不一定是实质上的显著。因为它表示处理效应大于随机效应，随机性由标准误测得，当样本很大时，小的处理效应也可以是显著的。
处理效应科恩d
科恩 d 值=平均数差／标准差= (M-υ)/σ

科恩d的效应.png

步骤

声明 H0
声明 H1
确定合适的统计量
确定显著性水平
判别合适的抽样分布
确定拒绝H0的区域
总结和分析数据

统计方法

平均数检验：单样本

z 检验（总体方差已知）

z=(M-υ)/σM= (M-υ)/σ／√n
置信区间 υ=M±zσM

置信区间：已知α水平，可根据α／2求得标准正态分布（均值0，标准差1）的 z-score,（因为求区间，因此取α／2），再根据上面的公式求得置信区间。

t 检验（总体方差未知）

大多数情况下总体参数未知。xxx统计学家以 student 的化名发表了 t 分布。用样本方差估计总体方差。

公式

t检验公式.png

公式中的分母 sM 是一个估计的标准误，用估计的标准差 s 替代总体标准差 σ

估计的标准误.png

s 如何计算呢？
总体方差 σ 平方=SS/n, SS=（总体每一数值-总体均值）的平方和，即总体数值与均值离差的平方和。

如下图是样本数值与均值的离差的平方和。它小于总体数值与均值离差的平方和。（因为总体的外延更大，会有极值没包含在样本内）

样本离差平方和.png

那么由于样本方差的分子小于总体方差的分子，在用样本数值估计总体方差时，改小分母，使估计精确。

因此用样本数值估计总体时，估计总体方差=s 平方=SS/n-1=SS/df

自由度：df=n-1
自由度：若一个数列15个数，平均数 u, 那么14个数可自由取值，由于均值确定，第15个数可得出，它是不自由的。因此自由度 n-1
t 分布的形态：接近于正态分布，样本越大，越接近正态分布
图
根据自由度、α值可得期望 t 值
置信区间（下述）
处理效应
- 科恩d值
  估计的d值=平均数差／估计总体标准差=(M-υ)/sM
- r平方
  
  r方公式.png
  
  r方大小解释.png
根本假设
- 样本中的数值都是独立观测的
- 样本来自的总体必须是正态分布（n很大时，误差不大）

平均数检验：双样本

独立样本检验

独立样本研究两个完全独立的样本。重复样本对同一样本使用不同的处理。

典型实验
研究两种教学方法的差异，一组同学使用方法一，另一组同学使用方法二。
公式

双样本t检验公式.png

公式表示用样本均值的差异来评估总体均值的差异

双样本t检验公式含义.png

分母计算：

双样本t检验分母.png

分母 sp平方（合并方差）用两个样本平均方差来表示每个样本的方差

自由度=df1+df2=n1+n2-2
处理效应
- 科恩估计d=平均数差／标准差
  
  双样本t检验科恩d.png
- r 方，同单样本检验
根本假设
- 每个样本中的观察都必须是独立的
- 两总体都必须是正态分布，但样本量大时关系不大
- 两总体方差相等
方差齐性检验：Hartley 检验
公式中的合并方差是两总体方差的均值，如果两总体方差不等，则这个值失去意义。
思路是：假设两总体方差相等，那么样本方差也近似。
- 公式：
  
  Hartley方差齐性公式.png
- k=独立的样本的个数（独立样本 t 检验中 k=2）
- df=n-1 对于每个样本来说，自由度为 n-1 ( 如果两个样本样本数不同呢？）
- 求值：在α，k, df, 已知时可求的 Fmax 临界值，如果观测值大于临界值，则齐性假设无根据，小于则总体方差相等。（等于？）
- 若方差不等，可以进行方差修正《基础》306
检验一般步骤(待补充)

重复样本检验

典型实验
对一组同学先使用某种教学方法测验，再用另一种方法，看哪种方法测验结果更好。
缺点和解决
时间因素和顺序效应：两次测试在时间上不同，变化可能是由时间引起；由于顺序问题，第2次测验可能疲惫（例如教学方法类测验）
解决：尽量抵消平衡。例如对于教学方法一二的测试。第1组被试先一后二，第二组先二后一。
公式

重复样本t检验公式.png

通过计算每个被试两次测验的差值，以这个差值作为样本数值，求均值并与总体均值比较。可看作单样本检验。

D 表示差值，sMD=独立样本检验的公式

效应大小
- 科恩估计d=样本差值平均数／样本标准差=MD/s
- r 平方，同单样本检验
检验一般步骤(待补充)

t 检验中总体均值的置信区间：

t检验总体均值置信区间.png

平均数检验：多样本方差分析

和t检验的区别：

可以测量多因素
可以既有因素，又有因素的 level
可以同时进行独立测量和重复测量
例如两组被试，每一组用不同的治疗方法（独立），每一组都在3个时间点测量（重复）

单因素：独立测量

典型实验：对3组样本，测量3种温度条件对学习成绩的影响

54E63A7D-904F-4FF3-903A-9FBE2ECB762A.png

公式：F=组间方差／组内方差=MS间／MS内
MS间=SS间/df间 MS内=SS内／df内
MS 表示均方，理解为方差
公式含义：处理效应引起的效应+个体差异和偶然误差／个体差异和偶然引起的效应
处理效应是否比偶然引起的效应大
公式计算：
组内方差=每组各自SS和／每组各自df和（合并方差）
组间方差=SS总-每组各自SS和／组间df
总方差=SS总／df总

方差分析单因素公式.png

df总=N-1 N=各样本数总和
df组内=n1+n2+n3-k=N-k k表示处理条件或因素水平的个数在这个典型实验里 k=3
df组间=k-1=df总-df组内
F分布: 起始为0，趋近于1的有偏分布。越靠右概率越小。

方差分析单因素分布.png
显著性检验：已知α和分子分母的自由度，可算出F期望。若F观测大于他，则拒绝H0
处理效应

方差分析单因素独立测量效应公式.png

方差分析中用η平方表示
事后检验：检测到底哪些处理效果起作用
- Tukey 检验
  公式
  
  Tuckey事后检验.png
  
  几个样本大小（n）必须一样
  已知k, df内，α，查表得 q
  HSD表示差异显著时所得值，可比较每组样本均值差是否大于HSD
- Scheffe 检验
  最安全的事后检验
检验一般步骤
- 声明 H0
- 声明 H1
- 确定合适的统计量
- 确定显著性水平
- 判别合适的抽样分布（若n>30，误差不大）
- 确定拒绝H0的区域
- 计算总、组间、组内分别3个 SS 和 df -> MS组间、组内 -> F 值
- 若F显著，Hartley 检验方差齐性
- 方差齐性检验显著／不显著，先修正F，检验处理效应r方？
- Tukey 事后检验
根本假设同 t 检验两个处理时 F=t方

单因素：重复测量

典型实验：测试不同分散注意力的情况对视觉任务的影响。对n个被试，要求在没有干扰、视觉干扰（闪光）、听觉干扰（噪音）时找出图片错误。考量3组处理，以处理为维度。
原理：

方差分析重复测量原理.png
计算公式：F处理间／F误差 =处理效应+偶然误差
（没有个体差异）／偶然误差（没有个体差异）
SS被试间

方差分析单因素SS被试间.png

Df被试间=n-1(n=被试数)
F 计算步骤
- 计算总、处理间、处理内分别3个 SS 和 df
- 计算F分母各成分，算出SS被试间 -> SS误差=SS处理内-SS被试间 df误差=df处理内-df被试间
- 计算分子分母 MS处理间=SS处理间／df处理间 MS误差=SS误差／df误差

方差分析重复测量计算.png

处理效应

方差分析单因素重复测量效应公式.png
Tukey /Scheffe 事后检验
同单因素，MS误差替代 MS处理内，df误差替代 df处理内
根本假定
- 每个处理条件里的观察必须是独立的
- 每个处理内的总体分布必须是正态分布，但样本量大时关系不大
- 每个处理的总体总体分布的方差是大体相当的
- 协方差齐性，每个被试在每个处理条件中都保持一定的相对位置
检验一般步骤

双因素／多因素

适用场景：考虑最简单的情况
- 双因素
- 只适用独立测量
- 样本大小相同
典型实验：3种温度和2种湿度对学习的影响，6种情况每种5个被试。
原理：

方差分析双因素原理.png
公式
FA=因素A方差均数／偶然误差
FB=因素B方差均数／偶然误差
FAB=不能用主效应解释的方差／偶然误差
计算步骤
- 计算总、处理间、处理内分别3个 SS 和 df
  典型实验里，df总=30-1 df处理间=6-1 df处理内=5*6-6
- 计算因素A、B、交互作用AB分别3个 SS 和 df
  dfA=A对应的行或列数-1 dfB同理 SSAB=SS处理间-SSA-SSB dfAB=df处理间-dfA-dfB
- 计算MS处理内、MSA、MSB、MSAB
- 计算FA=MSA/MS处理内 FB=MSB/MS处理内 FAB=MSAB/MS处理内
  
  方差分析双因素计算.png
处理效应

方差分析双因素效应公式.png

因素A 同 B 的公式
事后检验？
根本假定:同单因素独立测量检验=t检验
检验一般步骤

不学统计，不谈逻辑 |《行为科学统计》

不学统计，不谈逻辑 |《行为科学统计》

假设检验

含义

步骤