本系列是以《Survival Analysis——A Self-Learning Text》为主结合补充材料的学习重点记录。
I. 它是什么
通过统计学方法研究事件发生需要的时间。
II. 数据删失
由于研究到期、研究对象退出研究等原因,导致无法知道事件发生的时间。
III. 术语和符号
生存函数:S(t),存活时间超过t的概率。
风险函数:h(t),t时刻时的“死亡速度”。
原文并没有讲太多公式和推导相关,下面介绍一种我更容易理解的定义。
前置定义:
:随机变量,存活时间;
:T的概率密度函数;
:,T的累积分布函数;生存函数:
:,生存时间大于t的概率;风险函数:
:;
由于根据定义,
则:它们间关系:
IV. 生存分析的目的
- 通过数据估计生存、风险函数;
- 计算生存、风险函数;
- 建立生存时间和其他变量的关系模型。
V. 常见数据视图
VI. 用于理解和分析的数据视图
VII. 生存经验的描述性测量
X. 生存分析中的数学模型与常见回归模型对比
如何衡量效果:
- 线性回归:回归系数;
- 逻辑回归:优势比(odds ratio);
- 生存分析:风险比。
XI. 删失的假设
常见的删失假设:
- 个体间独立;
- 个体随机删失;
- 无信息。