前面提到的方法需要在各阶段样本量相等的情况下进行,并且期中分析的次数是固定的。虽然文献里提到等样本量的设计在样本量轻微不等的情况下也可以使用,而不会造成太大问题。但实际试验中,各阶段的样本量可能会有比较大的差异,并不一定每次都希望在等样本量的情况下进行分析,同时也会出现无法明确期中分析次数或临时增加期中分析次数的情况。如:
1. 某次期中分析时,结果已显示出较好的趋势,因此项目团队决定在此次分析与下次分析间增加一次分析,以有更早在终止研究的机会。
2. 入组速度太慢,想要增加期中分析次数,以提前终止 。
成组序贯的统计量为各个阶段统计项的线性加和
其中:
-
α-Spending Function Approach(Lan and DeMets)
alpha spending function允许任意时间点进行期中分析,只需要预先确定单调递增函数用于计算t时刻累计的一类错误,则可以针对离散的时间点
生成对应的界值
.
该方法考虑一类错误为信息时间的递增函数,满足α(0)=0且α(1)=1。当总体信息已知时,可以通过当前期中分析时的信息比计算出此次期中分析时累积的一类错误率。
Function需要在方案中提前定义及声明。总的分析次数及各次分析时间点可以不在方案中说明,但总样本量N需要说明。
对于两个信息时间s1和s2, 0 < s1 < s2 ≤ 1,相应的function为0 <α(s1) <α(s2) ≤ 1,为单调递增函数,即随着信息时间的增加,累积的一类错误率也随之增加。
如为第一次期中分析时可消耗的一类错误,
为累积至第二次期中分析时可消耗的一类错误。
因为第一次期中分析时已经消耗了,则第二阶段 可消耗的α为
。
对于给定的最大样本量N以及函数。第一次分析时的一类错误为
,
为第一阶段的信息比。
。
对于第二阶段,。
相对于前面提到的其他方法,Lan-Demets更灵活,体现在:
- 不需要事先制定次数或要求各次分析等距
- 将整个序贯设计过程看做是实验的总α被不断消耗的过程
- 以函数α(t)来表示,t为成组序贯的信息时间,当采用日历时间时,t为期中分析时所消耗的时间占总时间的比例。
对于给定的消耗函数以及一系列的Zk,相应的boundaries-ck通过以下方式计算:
- 近似OBF的函数
- 近似Pocock的函数
Pocock和OBF方法比较常用,其他的还有Lan-DeMets-Kim及Hwang-Shih等其他函数,需要时可以参考书。
不同方法对应有不同的膨胀因子及相对于样本量减少的百分比(完整的表看书):举例:
假设采用近似OBF的α-spending function。双侧检验,α=0.05,N=100。假如方案提前规定了三次期中分析。
第一次期中分析在n1=30时进行,则信息时间t1=0.30。将各个信息带入值上述
=
第二次期中分析在n2=60,信息时间t2=0.6时进行。同上将上述信息代入,=0.00762。注意这里是在累计样本量为60时的α,但在第一次期中分析时已经消耗了0.0009,针对第二次分析的α应为
最后一次分析的α可以通过类似的方法算出。
上述α通过EXCEL函数就可以验算。如果临时在第二次期中分析和最终分析中间增加了第三次期中分析,也可以通过同样的方法计算α,相应的最终分析的α会减小,但总的α不变。
需要注意的是,这本书里以及YuanYing教授的讲座中都提到虽然α-spending允许试验阶段增加期中分析,分析时间点及分析次数可以不提前设定,如某次期中分析结果已经快接近P<0.05,因此考虑在下一次分析前再增加一次期中分析。但在实际操作时,α-spending不允许由数据驱动(data-driven analysis strategy)增加分析,因为这样会增加一类错误,而应该采用相应的针对数据驱动设计的自适应设计。
α-spending用于控制一类错误,当试验需要无效中止的情况下,对应的也需要有β-spending function用以控制二类错误。
- 参考:Group Sequential and Confirmatory Adaptive Designs in Clinical Trials