预测模型建立/队列研究的样本量计算(包含交叉验证/boostrap验证)

近年来人工智能,预测模型的标书是一大热点。

预测模型主要是基于队列研究(前瞻或者回顾性的队列)。在标书撰写中,样本量计算是一个非常重要的部分。

下面介绍一下样本量计算,该样本量计算方法适用于探索危险因素研究、建立预测模型、队列研究,同时包含交叉验证/boostrap验证。

样本量计算(交叉验证)

建立预测模型时,建议所需的样本量应为拟分析因素总量的10倍到20倍,本研究预计纳入模型的因素约为20个,按拟分析因素总量的20倍进行样本量计算,应至少入选20*20=400例发生结局的患者。根据文献报道的结局的发生率约为20%,400/20%=2000人,则预估应纳入2000例患者,随机抽取70%的患者(即N=1400)用于建立预测模型,另外30%的患者(即N=600)对模型进行验证。

样本量计算(boostrap验证)

建立预测模型时,建议所需的样本量应为拟分析因素总量的10倍到20倍,本试验预计纳入模型的因素约为20个,按拟分析因素总量的20倍进行样本量计算,应至少入选20*20=400例发生结局的患者。根据文献报道的结局的发生率约为20%,400/20%=2000人,则预估应纳入2000例患者,采用bootstrap自主抽样的方法,有回放地抽取2000次,对模型进行验证。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容