1. 生存分析简介

本系列是以《Survival Analysis——A Self-Learning Text》为主结合补充材料的学习重点记录。

I. 它是什么

通过统计学方法研究事件发生需要的时间

II. 数据删失

由于研究到期、研究对象退出研究等原因,导致无法知道事件发生的时间。


右删失

III. 术语和符号

生存函数:S(t),存活时间超过t的概率。

理论生存函数示例

实际生存函数估算

风险函数:h(t),t时刻时的“死亡速度”。
三个风险函数例子

原文并没有讲太多公式和推导相关,下面介绍一种我更容易理解的定义。

前置定义
T:随机变量,存活时间;
f(t):T的概率密度函数;
F(t)P(T <= t),T的累积分布函数;

生存函数
S(t)S(t)=P(T > t) = 1 - F(t),生存时间大于t的概率;

风险函数
h(t)h(t) = \frac{f(t)}{S(t)}
由于根据定义f(t) = \lim_{\Delta_t -> 0}\frac{F(t + \Delta_t) - F(t)}{\Delta_t}
则:h(t) = \lim_{\Delta_t -> 0}\frac{F(t + \Delta_t) - F(t)}{\Delta_t * S(t)} = \lim_{\Delta_t -> 0}\frac{P(t < T<=t+\Delta_t)}{\Delta_t * P(T>t)} = \lim_{\Delta_t -> 0}\frac{P(t < T<=t+\Delta_t | T>t)}{\Delta_t }

它们间关系
h(t) =\frac{f(t)}{S(t)} = \frac{f(t)}{1 - F(t)}= -\frac{\partial{log[1 - F(t)]} }{\partial t} = -\frac{\partial{log[S(t)]} }{\partial t}

IV. 生存分析的目的

  1. 通过数据估计生存、风险函数;
  2. 计算生存、风险函数;
  3. 建立生存时间和其他变量的关系模型。

V. 常见数据视图

For computer
Counting Process

VI. 用于理解和分析的数据视图

For analysis

VII. 生存经验的描述性测量

X. 生存分析中的数学模型与常见回归模型对比

对比回归类模型

如何衡量效果

  • 线性回归:回归系数\beta;
  • 逻辑回归:优势比(odds ratio)e^\beta
  • 生存分析:风险比e^\beta

XI. 删失的假设

常见的删失假设:

  1. 个体间独立;
  2. 个体随机删失;
  3. 无信息。
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容