ROC曲线绘制中常见的问题及其解决方案

本文主要目的介绍做ROC曲线时遇到的问题和解决方法

#  SPSS可导入excel表格,真是省时间省力气

#  如何在SPSS中绘制ROC曲线,加深了一点新的体会就是在统计学中,应用一个方法去解决问题,首先需要明确用到的变量类型,定距(Scale)、定序(Ordinal)、定类(Nominal)。

主要遇到的问题有两个

 一是AUC值小于0.5,当时特别发愁,因为事先查到的资料是,我做出来诊断标准3 有一个的曲线下面积小于0.5。再次sou后发现可以通过转换0和1阳性事件来变通。个人理解是只要P值有意义,那么可以通过转换来实现AUC值大于0.5。

    二是今天最大的问题,分组标准从数据的中位数,平均数,还有ROC值线上取CUTOFF,我决定选择CUTOFF,图啥的也画好的了吧,这个值到底是多少?文献里都是这么写的。

我还走了一遍EXCEL表格期待找到我想要的CUTOFF

此时,一个优秀的科研工作者的内心有点烦躁,于是她想到了发朋友圈和继续谷歌的方法,甚至想去问老板。为了面子,她继续搜寻,看到了这样一句话:

通常情况下,SCI杂志会要求我们计算诊断实验中的最佳切割点,cutoff值,而SPSS恰好不能提供。R软件是一款统计功能十分强大的开源软件,OptimalCutpoints包是一个专门做ROC曲线和cutoff值的包,利用R软件可以轻松实现。不想写命令的可以使用基于OptimalCutpoints包的网页工具即可。

所以,那些文章里的CUTOFF值,只用SPSS,难道是目测出来的?

网页工具链接:强大的ROC页面工具easyROC: a web-tool for ROC curve analysis (ver. 1.3.1)

教程可见医统界推送:ROC曲线截断点(cutoff值)的计算

# spss的数据导出

   其实,如果她能养成一个好习惯,想好整个研究方案,就不用走#3之路了,数据导出后,NULL#值和时间的乱码都是很烦人的事情。

# R语言的数据读入

注定是意难忘了,深夜使用网页工具反复运算,查询后得知-------GG,网页极不稳定,不一定能顺利做出来,而且部分杂志对网页结果认可度不高。本次介绍直接用R软件OptimalCutpoints包来计算,结果具有可重复性。

然后发现R读不进exc

解决办法

1.安装readxl包-TMD的失败

2.把excel表格转换为TXT

将Excel转TXT,而且在TXT中将表格以“,逗号”隔开的方式来排序,这样有利于我们区分!操作方法:先将Excel表格“文件”-->另存为,然后选择“CSV”格式;然后将“CSV”格式文件用“记事本”来打开

此方法经验证,有效

#用R进行CUTOFF的计算

找到一篇让自己非常无语的文章

一篇文章在写自己这个程序怎么好,那你倒是告诉我,这个程度在哪里呀,额,浪费我一番心血为了下载这篇文章,口吐芬芳

#如何了解一个包的用法

第一种方法,查看说明书:函数——?OptimalCutpoints---但是您也只能了解它的说明

查看了说明,于是照着写代码,发现不行,参照其示例数据elas的格式,真的委曲求全

改后,我他妈这个还不行,我就,也目测cutoff值好了 

目测是不可能目测的,然后发现CSV格式读进去的,不行。问了程师姐,师姐说,用str_split函数,我又不敢继续问,只能继续探索。

我要怎么把它往上挪一行呢
这真是个天赐的好技巧,但是如果数据太大, 还是别这么搞了,容易让自己被动

此处省略我是如何重新命名了行,然后进行了数据转换,大神一句话,菜鸟跑半年

fuck

第二种方法,亲测有效,查看其示例数据,参照其示例数据elas的格式(真的委曲求全),做到数据格式和他一样,然后修改相应的参数

elas是OptimalCutpoints包自带的数据:该数据来自于加利西亚综合医院的心脏病科。本研究旨在评估白细胞弹性蛋白酶测定在冠状动脉疾病(CAD)诊断中的临床应用价值。这个数据框,包括了3个变量,纳入141例病例。elas:白细胞弹性蛋白酶。为数值型向量;status疾病状态(存在/不存在冠状动脉疾病)。赋值为0和1;gender患者的性别分为两个水平,Male和Female。

install.packages("OptimalCutpoints") #安装OptimalCutpoints包

library(OptimalCutpoints) #加载OptimalCutpoints包

data(elas) #加载数据

summary(elas) #总结数据

head(elas,5) #查看前5行数据

# Defaut method

optimal.cutpoint.Youden <- optimal.cutpoints(X = "elas", status = "status", tag.healthy = 0, 

methods = "Youden", data = elas, pop.prev = NULL, categorical.cov = "gender", 

control = control.cutpoints(), ci.fit = FALSE, conf.level = 0.95, trace = FALSE)

summary(optimal.cutpoint.Youden)

plot(optimal.cutpoint.Youden)

参考了公众号这个文章:ROC曲线最佳截断点(cutoff值)计算-OptimalCutpoints包简介

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,254评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,875评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,682评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,896评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,015评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,152评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,208评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,962评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,388评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,700评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,867评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,551评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,186评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,901评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,689评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,757评论 2 351

推荐阅读更多精彩内容