本文主要目的介绍做ROC曲线时遇到的问题和解决方法
# SPSS可导入excel表格,真是省时间省力气
# 如何在SPSS中绘制ROC曲线,加深了一点新的体会就是在统计学中,应用一个方法去解决问题,首先需要明确用到的变量类型,定距(Scale)、定序(Ordinal)、定类(Nominal)。
主要遇到的问题有两个
一是AUC值小于0.5,当时特别发愁,因为事先查到的资料是,我做出来诊断标准3 有一个的曲线下面积小于0.5。再次sou后发现可以通过转换0和1阳性事件来变通。个人理解是只要P值有意义,那么可以通过转换来实现AUC值大于0.5。
二是今天最大的问题,分组标准从数据的中位数,平均数,还有ROC值线上取CUTOFF,我决定选择CUTOFF,图啥的也画好的了吧,这个值到底是多少?文献里都是这么写的。
此时,一个优秀的科研工作者的内心有点烦躁,于是她想到了发朋友圈和继续谷歌的方法,甚至想去问老板。为了面子,她继续搜寻,看到了这样一句话:
通常情况下,SCI杂志会要求我们计算诊断实验中的最佳切割点,cutoff值,而SPSS恰好不能提供。
R软件是一款统计功能十分强大的开源软件,OptimalCutpoints包是一个专门做ROC曲线和cutoff值的包,利用R软件可以轻松实现。不想写命令的可以使用基于OptimalCutpoints包的网页工具即可。
所以,那些文章里的CUTOFF值,只用SPSS,难道是目测出来的?
网页工具链接:强大的ROC页面工具easyROC: a web-tool for ROC curve analysis (ver. 1.3.1)
教程可见医统界推送:ROC曲线截断点(cutoff值)的计算
# spss的数据导出
其实,如果她能养成一个好习惯,想好整个研究方案,就不用走#3之路了,数据导出后,NULL#值和时间的乱码都是很烦人的事情。
# R语言的数据读入
注定是意难忘了,深夜使用网页工具反复运算,查询后得知-------GG,网页极不稳定,不一定能顺利做出来,而且部分杂志对网页结果认可度不高。本次介绍直接用R软件OptimalCutpoints包来计算,结果具有可重复性。
然后发现R读不进exc
解决办法
1.安装readxl包-TMD的失败
2.把excel表格转换为TXT
将Excel转TXT,而且在TXT中将表格以“,逗号”隔开的方式来排序,这样有利于我们区分!操作方法:先将Excel表格“文件”-->另存为,然后选择“CSV”格式;然后将“CSV”格式文件用“记事本”来打开
此方法经验证,有效
#用R进行CUTOFF的计算
一篇文章在写自己这个程序怎么好,那你倒是告诉我,这个程度在哪里呀,额,浪费我一番心血为了下载这篇文章,口吐芬芳
#如何了解一个包的用法
第一种方法,查看说明书:函数——?OptimalCutpoints---但是您也只能了解它的说明
查看了说明,于是照着写代码,发现不行,参照其示例数据elas的格式,真的委曲求全
目测是不可能目测的,然后发现CSV格式读进去的,不行。问了程师姐,师姐说,用str_split函数,我又不敢继续问,只能继续探索。
此处省略我是如何重新命名了行,然后进行了数据转换,大神一句话,菜鸟跑半年
第二种方法,亲测有效,查看其示例数据,参照其示例数据elas的格式(真的委曲求全),做到数据格式和他一样,然后修改相应的参数
elas是OptimalCutpoints包自带的数据:该数据来自于加利西亚综合医院的心脏病科。本研究旨在评估白细胞弹性蛋白酶测定在冠状动脉疾病(CAD)诊断中的临床应用价值。这个数据框,包括了3个变量,纳入141例病例。elas:白细胞弹性蛋白酶。为数值型向量;status疾病状态(存在/不存在冠状动脉疾病)。赋值为0和1;gender患者的性别分为两个水平,Male和Female。
install.packages("OptimalCutpoints") #安装OptimalCutpoints包
library(OptimalCutpoints) #加载OptimalCutpoints包
data(elas) #加载数据
summary(elas) #总结数据
head(elas,5) #查看前5行数据
# Defaut method
optimal.cutpoint.Youden <- optimal.cutpoints(X = "elas", status = "status", tag.healthy = 0,
methods = "Youden", data = elas, pop.prev = NULL, categorical.cov = "gender",
control = control.cutpoints(), ci.fit = FALSE, conf.level = 0.95, trace = FALSE)
summary(optimal.cutpoint.Youden)
plot(optimal.cutpoint.Youden)
参考了公众号这个文章:ROC曲线最佳截断点(cutoff值)计算-OptimalCutpoints包简介