统计分析策略
内容:统计学方法,学会统计软件,阅读结果正确做出统计报告
医学研究类型决定统计分析策略
实验性研究
RCT
特点:分组均衡、混杂偏倚小
故采用简单统计方法:
- t.test
- F检验(方差分析)
- 卡方检验
- 秩和检验
观察性研究
特点:分组不均衡、混杂偏倚大
采用高级统计分析:
简单统计+线性回归、logistic回归、Cox回归控制偏倚
除了医学研究类型决定统计分析策略之外,还需要考虑数据类型、数据分布以及多因素串扰等
数据类型
定量变量数据
定性变量数据
有序变量数据
数据分布
正态、非正态(正偏态、负偏态)
**综上,一个良好的统计分析策略要考虑因素有:研究类型是什么?
实验分组合理否?干扰因素(混杂变量)有哪些?
研究因素(自变量)有哪些?
结局变量(因变量)是定性、定量还是等级类型?
如果定量,那么正态,还是偏态分布呢?
数据比较是2组之间还是多组?
实验性研究定量数据的统计分析方法
定量数据正态性判定
正态性数据
参数检验——t.test F检验(方差分布)
偏态型数据
- 数据转换为正态数据->参数检验
- 直接使用非参数秩和检验方法,常用秩和检验
正态性判断方法
- K-S法:Kolomogorov-Smirnov Test
- S-W法:Shapiro-Wilk Test(更常用) 小样本(各组样本30-50例)推荐
适用于样本量2000以下
H0 分布符合正态
p<0.05,偏态,P>0.05 正态
- 直方图 hist()函数
- QQ图(quantile-quantile plot)判断样本是否近似于某种分布,或验证两组数据是否来自同一分布。 数据分布合理——位于对角线上。
实际研究中的正态性
样本量较大时,样本稍微偏态,可能经检验不符合正态,但若理论上该变量总体符合正态,直方图,QQ图近似正态,可认为正态
分类
- 正态分布 正态性检验P>0.05
- 近似正态分布 正态性检验P<0.05,但是直方图/QQ图显示大致正态,无特别极端值。
分析策略: 均值、标准差、t.test,F.test等参数检验 - 严重偏态分布 正态性检验P<0.05,数据严重偏态或存在明显极端异常值
分析策略: 中位数、四分位数间距描述、非参数秩和检验
注意:
小样本(30以内)直接看Pvalue,样本量较大时,结合直方图。