假设某试验两组分别为标准治疗组(Standard treatment)及新疗法组(New treatment),t时刻,标准治疗组的风险函数为,新疗法组的风险函数为,风险比为ψ。即
-->
使;
当θ=0时,此时ψ=1,,两组无差异
当θ<0时,此时ψ<1,,新疗法组的风险小,生存时间长
当θ>0时,此时ψ>1,,标准组的风险小,生存时间长
生存分析中,首先需要考虑事件数(如死亡例数)。K-M曲线图中,如果事件数不够,那么中位生存时间很可能就无法估计(50%生存率没有达到,无法对应到X轴上的生存时间)。事件数估计出来之后,再通过事件数估计所需的病例数,即总样本量。
假设θ为实际风险比,为目标值,一类错误为α,把握度为1-β。
则事件数为,
π为组间分配比例,当组间比例为1:1时,π=0.5,
--------------------------推断过程---------------------------
假设有r个互不相同(不打结)的死亡时间,t(1)<t(2)<...<t(r),组别i=1/2,时间点j=1,2,...,r。在时间点t(j),第i组期初人数(at risk)为,总例数为,死亡例数为,
Log-rank统计量为
方差为
为理论死亡例数,。
- 当统计量|U|>k时,拒绝原假设θ=0。
原假设成立时,
备择假设成立时,
U~,统计量U符合均值为θV,方差为V的正态分布。
当原假设成立时,θ=0,此时U~,此时为以0对称的正态分布,
,Φ为标准正态分布的累计概率密度函数。
U~ 经过变化可化为标准正态分布 ~,即
~
当备择假设成立时,,此时U~,此时,
正态分布均值要么在0左右要么在0右边,此时两边中的其中一边可以忽略,所以简化为
,
即
- 由上述得到两个等式
及
将k、α及β代入式2后得到
同时
当死亡人数很少时,上式可以近似为
更进一步,如果θ很小,且每组受试者入组的概率近乎相同,则
,
则
当不同组入组比例不相同时,
,
则
---------------------由死亡事件数计算样本量--------------------
由事件数计算所需病例数,需要考虑研究过程中的死亡概率。假设受试者入组时长为a(accrual period),入组结束后还有一定的随访时长f(follow-up period),试验的总时长为a+f。当随访时间f较短时,可能出现的死亡事件数越少,因此对于同样的事件数,f越短,所需的病例数越多。
当受试者的死亡概率确定后,总样本量为
d为前面算出的死亡例数,P(death)为死亡概率。
(1)
其中
和分别为标准治疗和新治疗的生存函数时刻t时的估计值。
对于组别1:
对于组别2:
当组间分配比例为1:1时,
由此得出式(1)。
当组间分配比例不为1:1时,假设组1为π,组2为1-π。
*参考《Modelling Survival Data in Medical Research》和B站[潘老师学肿瘤设计],讲的很清楚