ROC(Receiver Operator Characteristic Curve,受试者工作特征曲线)曲线
ROC分析的是结局变量是二元分类模型,也就是输出结果只有两种类别的模型(也可以延拓到生存类模型)。
ROC是二分类模型的评价工具之一,ROC曲线是以FPR(False Positive Rate,假阳性率)为横坐标,TPR(True Positive Rate,真阳性率)为纵坐标,绘制的曲线。
这里简要概述几个指标的定义,包括TP,FP,TN,FN,TPR,FPR,TNR,FNR,Sensitivity,Specificity。
阳性 (P, positive)
阴性 (N, Negative)
真阳性 (TP, true positive),预测的阳性为真阳性
真阴性 (TN, true negative),预测的阴性为真阴性
伪阳性 (FP, false positive),预测的阳性为假阳性,又称第一型错误
伪阴性 (FN, false negative),预测的阴性为假阴性,又称第二型错误
真阳性率 (TPR, true positive rate),又称敏感度(sensitivity),TPR = TP / P = TP / (TP+FN)
伪阳性率(FPR, false positive rate),FPR = FP / N = FP / (FP + TN)
真阴性率 (TNR, true negative rate),又称特意度(specificity),TNR = TN / N = TN / (TN+FP)
可见,FPR=1-specificity
准确度(ACC, accuracy),ACC = (TP + TN) / (P + N),即:(真阳性+真阴性) / 总样本数
阳性预测值 (PPV),PPV = TP / (TP + FP)
阴性预测值 (NPV),NPV = TN / (TN + FN)
假发现率 (FDR),FDR = FP / (FP + TP)
其他可参考:https://wap.sciencenet.cn/blog-3428464-1248658.html?mobile=1
ROC曲线中重要的一个指标是AUC(Area Under Curve,曲线下面积),常用于衡量模型预测的好坏。