森林图(上)

参考学习资料forestplot包用HR结果绘制森林图
其实一开始看到森林图完全搞不懂是在做什么,上次在2020-01-07-TCGA之RTCGA中有跟着冰糖用survminer绘制cox图中学到cox回归还可以展示森林图。
今天再来探索一下。看能不能完成曾老师的新作业为什么不用TCGA数据库来看感兴趣基因的生存情况

首先下载数据

参考TCGA数据库生存分析的网页工具哪家强使用http://www.oncolnc.org下载数据到R。

找到网站打开,按提示输入感兴趣的基因然后选择要研究的癌症类型下载数据

在R里面重新画oncolnc数据

直接套用曾老的代码

rm(list=ls())
options(stringsAsFactors = F) 
# http://www.oncolnc.org/kaplan/?lower=50&upper=50&cancer=BRCA&gene_id=11156&raw=PTP4A3&species=mRNA
f='BRCA_11156_50_50.csv'
a=read.table(f,
             header = T,sep = ',',fill = T)
colnames(a)
dat=a
colnames(dat)
library(ggstatsplot)
ggbetweenstats(data =dat, 
               x = Group,  y = 'Expression')

ggbetweenstats(data =dat, 
               x = Status,  y = 'Expression')
#前面这个部分不知道在干嘛,反正2次都报错了了,我还没整明白,但是下面的运行没有问题
library(ggplot2)
library(survival)
library(survminer) 
table(dat$Status)
dat$Status=ifelse(dat$Status=='Dead',1,0)
sfit <- survfit(Surv(Days, Status)~Group, data=dat)
sfit
summary(sfit)
ggsurvplot(sfit, conf.int=F, pval=TRUE) 

生存分析结果如图所示:


不知道有什么意义,好像没有意义

如果用这个包里面的森林图函数需要指定模型

head(dat)
model <- coxph( Surv(Days, Status) ~  Expression + Group, data =  dat )
ggforest(model,  #coxph得到的Cox回归结果
         data = dat,  #数据集
         main = 'Hazard ratio of BRCA_PTP4A3',  #标题
         #cpositions = c(0.05, 0.15, 0.35),  #前三列距离
         fontsize = 1, #字体大小
         refLabel = 'reference', #相对变量的数值标签,也可改为1
         noDigits = 3 #保留HR值以及95%CI的小数位数
)

由于没有获取更多的原始数据,因此得到的结果只有一个:

生存分析的cox森林图

这里最重要的是指定这个模型coxph函数的定义。
再返回网易工具查看相关信息:
http://www.oncolnc.org/search_results/?q=PTP4A3

Cox regression results for PTP4A3在不同癌症的分析结果展示,通过本次作业回顾了生存分析的数据获取及森林图相关的概念,终于有了初步的认识。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容