定义:
临床预测模型(又称临床预测规则、预测模型或者风险评分):指利用多因素模型估算患有某病的概率或者将来某结局发生的概率。
方法:
传统统计方法:多因素回归分析构建预测模型。
机器学习方法:聚类、分类等机器学习算法进行预测模型构建。
分类:
包括诊断模型(Diagnostic models)和预后模型(Prognostic Models)。
诊断模型:是基于研究对象的临床症状和特征,诊断当前患有某种疾病的概率,多见于横断面研究;、
预后模型:是在当下的疾病状态下,未来某段时间内疾病复发、死亡、伤残以及出现并发症等结局的概率,多见于队列研究。
设计人群的选择
前瞻性队列研究人群:最佳,可以展现疾病的自然进程,也便于更有计划的测量预测因子和结局。
病例对照研究人群:无法计算绝对风险,而且病例和对照的来源的总体人群未知,研究者可以自由的选择病例和对照,导致结果易出现偏倚。
随机对照临床试验人群:因临床试验人群的有严格的入排标准,所以人群的外推性较差。如果干预措施无效,则可以直接合并数据;如果干预措施有效,需要把干预变量当做一个独立的预测因子纳入多因素模型。
样本量估计
当预测因子的个数远大于结局事件的个数时,就有可能过度估计模型的效果。
理想情况下,建立预测模型至少需要几百个结局事件,有研究文献表明,一个预测因子至少需要10个结局事件是比较保守的估计。
预测因子和结局的选择
预测因子选择
可社会人口学特征、病史、体格检查、疾病特征、检测结果以及治疗历史中筛选。治疗措施在随机对照临床试验中可以当做预测因子,但在观察性研究中不推荐。
预测因子应具有以下特征:
(1) 应该具有明确定义、标准化、可重复,
(2)预测因子的检测方法,应该是日常使用的方法。
(3)预测因子应是能够测量到,且容易获得。
在观察性研究中,由于治疗措施、适应征并不是统一规范的,将其纳入作为预测因子可能引入偏倚,故不推荐,且治疗措施相比年龄、性别、疾病分期来说,预测价值很小。
结局的选择
病人最关注的结局:应作为首选,疾病的复发、死亡、并发症、肿瘤增生、疼痛、治疗反应以及生存质量。
替代指标和中间指标:不建议用作结局指标, 除非此替代指标或中间指标与最终结局有明确的因果关联,如CD4细胞计 数与AIDS进展和死亡;
结局的测量:
应该是在不需知晓预测因子的情况下进行结局指标的测量,以免引入偏倚。
预测研究一般有三个步骤:
开发预测模型
验证预测模型
研究模型临床意义
具体见汇总图,后续将对临床预测模型慢慢展开。