近年来人工智能,预测模型的标书是一大热点。
预测模型主要是基于队列研究(前瞻或者回顾性的队列)。在标书撰写中,样本量计算是一个非常重要的部分。
下面介绍一下样本量计算,该样本量计算方法适用于探索危险因素研究、建立预测模型、队列研究,同时包含交叉验证/boostrap验证。
样本量计算(交叉验证)
建立预测模型时,建议所需的样本量应为拟分析因素总量的10倍到20倍,本研究预计纳入模型的因素约为20个,按拟分析因素总量的20倍进行样本量计算,应至少入选20*20=400例发生结局的患者。根据文献报道的结局的发生率约为20%,400/20%=2000人,则预估应纳入2000例患者,随机抽取70%的患者(即N=1400)用于建立预测模型,另外30%的患者(即N=600)对模型进行验证。
样本量计算(boostrap验证)
建立预测模型时,建议所需的样本量应为拟分析因素总量的10倍到20倍,本试验预计纳入模型的因素约为20个,按拟分析因素总量的20倍进行样本量计算,应至少入选20*20=400例发生结局的患者。根据文献报道的结局的发生率约为20%,400/20%=2000人,则预估应纳入2000例患者,采用bootstrap自主抽样的方法,有回放地抽取2000次,对模型进行验证。