生存分析:是将事件的结果(终点事件)和出现这一结果所经历的时间结合起来分析的一种统计分析方法。
可以是任何事件
生存分析不同于其它多因素分析的主要区别点就是:生存分析考虑了每个观测出现某一结局的时间长短
生存时间:是指终点事件与起始事件之间的时间间隔
终点事件:是指研究者所关心的特定结局
起始事件:是指反映研究对象生存过程的起始特征事件
生存时间的类型
1、完全数据:
指事件从开始到事件结束,观察对象一直都处于观察范围内,我们得到了事件从开始到结束的准确时间。
2、截尾数据(删失数据):指在研究分析过程中由于某些原因,未能得到所研究个体的准确时间,这个数据就是删失数据
3、截尾原因:失访、死于其他疾病、观察结束时病人尚存活等,在动物实验研究中大多由于研究观察时间已到,不能继续下去所造成。
生存资料的主要特点
1、含有截尾数据
2、截尾数据的特点:真实的生存时间未知,只知道比观察到的截尾生存时间要长
3、生存时间的分布一般不呈正态分布
生存概率
从某单位时间段开始,存活的个体到该时间段结束时个体仍存活的可能性,又称生存率
生存概率 = 下一时段开始的人数/该时段开始的人数 = 1- 死亡率
生存函数: 某时间t存活的概率
生存曲线
以观察(随访)时间为横轴,以生存率为纵轴,将各个时间点所对应的生存率连接在一起的曲线图。
生存曲线是一条下降的曲线,分析时应注意曲线的高度和下降的坡度。
平缓的生存曲线表示高生存率或较长的生存期,陡峭的生存曲线表示低生存率或较短生存期
曲线上有“+”,说明有删失数据
生存分析的方法
1.参数方法--少用,需要满足某些分布模型
2、半参数方法--Cox模型
3、非参数方法--寿命表分析法 和 K-M方法
生存分析的SPSS操作
1、寿命表法:适用于样本量较大,通常数据先按时间段进行分区组,然后再进行相应的分析
2、 Kaplan-Merier 法:利用概率乘法定理计算生存率,又称乘积极限法,适用于小样本或大样本未分区组资料分析
每一个样本计算生存时间
其内部含三种算法,均选择,到时候选差异明显的即可,报道自己选择的具体哪一种算法
3、cox Regression 法:用以描述多个变量对生存时间的影响。此时可控制一个或几个因素,考察其他因素对生存时间的影响,及各因素之间的交互作用。
各因素的差异 各因素对结局的影响
生存分析必须要有结局事件和结局时间
有点类似于Logistic回归模型
此外还有时间依赖性Cox回归,可以看出发病时年龄对疾病的意义,不过不能作图。
补充:per 1 sd
不符合正态分布,就进行标准化
分析--描述统计--描述 选择标准化 (通常是以0位均值,1为标准差,Z score)
可以自行查看z score确定
所以对于标准化后的数据,因为标准差为1,所以数据每增加一个单位,就是一个标准差,所以就是per 1 sd