ROC分析是临床数据联合分析的重要内容,用于发现和验证诊断和预后的生物标志物。前文我们讲述了“Graphpad绘制受试者工作特征(ROC)曲线教程”,那么在R中能不能绘制ROC曲线呢?接下来,我们仿照文献Expression profiles of circRNAs and the potential diagnostic value of serum circMARK3 in human acute Stanford type A aortic dissection中Figure 6B的风格,在R中绘制ROC曲线。
视频教程:
我们录制了操作视频,手把手呈现分析细节,并对可能遇到的问题做了详解。
bilibili超清视频链接:https://www.bilibili.com/video/BV175411Y75u/
图文教程
以下是图文版的简化教程。
1 准备输入数据
示例数据中需要包含3列信息:样品编号、生存状态和基因的表达量值。示例数据文件为示例数据.txt,通过Excel打开,查看示例数据的格式。
2 分析过程
具体操作方法可参考视频。
3 使用pROC包进行ROC分析
ROC分析主要使用生存状态和基因的表达量值的数据。首先将基因表达量的数据有小到大排列,并按照生存状态计算ROC的节点和AUC值。最佳分割点筛选出节点中距离左上角最近的节点,该点相对具有更高的敏感性和特异性。结果文件保存在文件ROC.result.txt中,内容包括:(1)用于ROC分析的基因;(2)AUC值;(3)AUC值的95%置信区间;(4)最佳分割点对应的值;(5)最佳分割点对应的敏感性;(6)最佳分割点对应的特异性。
4 输出ROC曲线
将ROC曲线作图结果输出到PDF文件中,并将AUC、最佳分割点以及对应的敏感性和特异性标注出来。
5 绘制多个ROC曲线
ROC分析可以比较不同模型的预测能力,将不同预测模型的ROC曲线绘制在一张图中,可以直观地比较不同模型的预测能力。比如文献Aberrantly glycosylated integrin α3β1 is a unique urinary biomarker for the diagnosis of bladder cancer中的Figure 2C中就验证了AG31在BC和其他组都有很好的预测能力。
这里,我们对3种不同的基因进行ROC分析,比较3个ROC曲线对应的AUC值,其中,gene3作为预后的模型更准确。