生统笔记7-生存分析之KM曲线

定义

  • Kaplan-Meier(KM)曲线是一种描述性统计工具,用于估计生存函数的非参数统计方法。不需要建立和求解模型

  • KM曲线仅依赖于生存时间和事件状态,不考虑其他协变量。适合单变量分析或描述性研究。


KM曲线的绘制

  1. 将所有事件发生的时间点按升序排列,并记录在这些时间点发生的事件数和仍然生存的个体数。

  2. 计算生存概率:对于每个时间点 t,计算生存概率 S(t)

  3. 初始化:在第一个时间点,生存概率 S(0) 通常设定为1

  4. 对所有时间点重复上述步骤,逐步更新生存概率,直到最后一个时间点

  5. 绘图


KM曲线的置信区间

  1. 生存函数估计
    Kaplan-Meier方法通过处理生存数据(如事件发生的时间和状态)来估计生存函数 S(t),即在时间 t 之前生存的概率。该方法根据每个事件(如死亡)和每个时间点的生存个体数进行计算。

  2. 标准误差的计算

标准误差的计算

理论依据

  • 二项分布的近似:KM方法假设生存概率遵循某种二项分布,当个体在每个时间点的生存状态相互独立时,事件的发生可以视为一个二项试验。

  • 中心极限定理:当样本量较大时,生存概率的分布可以近似为正态分布。SE的计算正是基于这种近似,以估计生存概率的不确定性。


两组生存时间的差异检验

Log-Rank检验,通常称为“对数秩检验”。

步骤:

  1. 提出假设:零假设(H0):两组生存曲线无显著差异。对立假设(H1):两组生存曲线有显著差异。

  2. 计算期望事件数:对于每个时间点,计算各组的期望事件数,使用以下公式:

计算期望事件数
  1. 计算Log-Rank统计量
Log-Rank统计量
  1. 使用卡方分布查找相应的p值。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容