首先,一个随机对照试验的关键在于其随机化方法的正确选择与实施,目前可以选择的随机化方法,从实施机构来说,分为中央随机化或分中心随机化;从实施对象的分组分为分层随机化、区组随机化等;从是否有可能改变纳入患者的分组情况可分为固定随机化或动态随机化。以下我们逐步来解释中央分层区组随机及其临床流行病学方面的考虑。
中央随机化
当一个随机对照试验有多个分中心的时候,我们可以选择是让一个“中央”统一实现随机化或让不同的分中心实施随机化。笔者认为如果让不同分中心实施随机化有可能有以下几个问题:1:即使是三期临床试验,样本量一般也就在百例水平,如果分到各个分中心,每个分中心的样本量太少,再进行随机化的时候容易产生极大的不均衡性;2:不同分中心的样本量分配具有一定的主观性,如根据不同分中心年收治患者数量或病床数量,这很可能会引入选择偏倚及影响统计学效能;3:由于不同分中心的在连续入组时其可能不同步,如果不采用中央随机化及竞争入组的方法纳入患者,可能会出现某些分中心已入组解释,而另一个分中心还没有纳够的情况,这种情况无论是改变原方案重新分配患者或继续等待都是不合适。
因此,笔者认为如果有多个分中心的时候,研究者应该进行中央随机化,并竞争入组,既由统一的“随机化中心”进行随机化并在患者通过筛选后进行随机后入组。
分层随机化
为了保证不同分组的患者在重要基线特征上具有可比性,因此我们需要对患者进行分层随机化,这在笔者以前的文章中曾经给予过说明。按照既往临床流行病学习惯,这类情况下就是按照不同的分层因素及每个因素的不同的水平对患者进行亚组分类,然后在每个亚组里进行简单随机化。如我们考虑一种新治疗方式是否有效,然后性别进行分层,既在分别在男性及女性患者中进行简单随机化,男性中及女性中均按照1:1比例把患者分为新治疗组及对照组。
区组随机化及随机区组
分层随机化虽然可以保证不同纳入患者在重要的基线特征的平衡,但是其在每个亚组内如果进行简单随机化,有可能导致治疗组及对照组发生极大的不均衡性,如下图所示
有可能会出现此类情况,虽然进行了随机化,但是因为样本量过少,治疗因素的分配非常的不均衡,这很有可能影响我们得最终结论,根据计算,在总样本量不变的情况,只有在1:1入组的时候才能获得最大的统计学效能(或者说获得最大的把握度),因此,为了解决这一问题,我们引入区组随机化,比如我们设定设定一个区组大小为4的区组并强制要求其中必须有2个治疗组及2个对着组,然后这40例患者分为10个区组,这样就可以保证分配的均衡性。
上述的固定区组虽然好,但也会产生问题。固定区组后每个区间的最后1-2个患者的分组情况事先猜测出来了,这可能会产生选择或信息偏倚,因此,我们引入了随机区组大小的区组随机化,这时候的区组就不固定了,比如可以随机设定为4,6,8,10等数字,由软件统一实现,这样所有患者的随机结果就无法知道。
随机盲法设置的原因及实现途径
随机化的根本目的是为到达非试验因素的组件均衡性,这种均衡性不仅仅体现在患者基线信息表中我们纳入的混杂因素或者说协变量上,更重要的是其可以平衡未测量混杂因素并使其达到均衡。随着真是世界研究方法学的进步,生物信息学的发展及大数据的应用,重要混杂因素的调整方法及结论稳健性评估的方法不断涌现,但是其始终无法调整这种未测量混杂因素,笔者认为这是目前任何试验无法替代RCT试验的重要原因。为了实现这种均衡性,随机化的方法尤为重要,有些临床试验虽然无法在治疗或非治疗的方式对医师、患者或者第三方监理方实现盲法,但是随机化的盲法是易于实现且有益的。如果事先就知道所有序位患者的分组情况,无疑在患者入组时会产生选择偏倚。
为此,需要独立的第三方“独立数据委员会”进行中央随机化,并根据重要的预后因素进行分层区组随机化,区组大小不固定。