ROC曲线

ROC(Receiver Operator Characteristic Curve,受试者工作特征曲线)曲线

ROC分析的是结局变量是二元分类模型,也就是输出结果只有两种类别的模型(也可以延拓到生存类模型)。

ROC是二分类模型的评价工具之一,ROC曲线是以FPR(False Positive Rate,假阳性率)为横坐标,TPR(True Positive Rate,真阳性率)为纵坐标,绘制的曲线。

这里简要概述几个指标的定义,包括TP,FP,TN,FN,TPR,FPR,TNR,FNR,Sensitivity,Specificity。

阳性 (P, positive)

阴性 (N, Negative)

真阳性 (TP, true positive),预测的阳性为真阳性

真阴性 (TN, true negative),预测的阴性为真阴性

伪阳性 (FP, false positive),预测的阳性为假阳性,又称第一型错误

伪阴性 (FN, false negative),预测的阴性为假阴性,又称第二型错误

真阳性率 (TPR, true positive rate),又称敏感度(sensitivity)TPR = TP / P = TP / (TP+FN)

伪阳性率(FPR, false positive rate),FPR = FP / N = FP / (FP + TN)

真阴性率 (TNR, true negative rate),又称特意度(specificity)TNR = TN / N = TN / (TN+FP)

可见,FPR=1-specificity

准确度(ACC, accuracy),ACC = (TP + TN) / (P + N),即:(真阳性+真阴性) / 总样本数

阳性预测值 (PPV),PPV = TP / (TP + FP)

阴性预测值 (NPV),NPV = TN / (TN + FN)

假发现率 (FDR),FDR = FP / (FP + TP)

其他可参考:https://wap.sciencenet.cn/blog-3428464-1248658.html?mobile=1

ROC曲线中重要的一个指标是AUC(Area Under Curve,曲线下面积),常用于衡量模型预测的好坏。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容