参考学习资料forestplot包用HR结果绘制森林图
其实一开始看到森林图完全搞不懂是在做什么,上次在2020-01-07-TCGA之RTCGA中有跟着冰糖用survminer
绘制cox图中学到cox回归还可以展示森林图。
今天再来探索一下。看能不能完成曾老师的新作业为什么不用TCGA数据库来看感兴趣基因的生存情况
首先下载数据
参考TCGA数据库生存分析的网页工具哪家强使用http://www.oncolnc.org下载数据到R。
在R里面重新画oncolnc数据
直接套用曾老的代码
rm(list=ls())
options(stringsAsFactors = F)
# http://www.oncolnc.org/kaplan/?lower=50&upper=50&cancer=BRCA&gene_id=11156&raw=PTP4A3&species=mRNA
f='BRCA_11156_50_50.csv'
a=read.table(f,
header = T,sep = ',',fill = T)
colnames(a)
dat=a
colnames(dat)
library(ggstatsplot)
ggbetweenstats(data =dat,
x = Group, y = 'Expression')
ggbetweenstats(data =dat,
x = Status, y = 'Expression')
#前面这个部分不知道在干嘛,反正2次都报错了了,我还没整明白,但是下面的运行没有问题
library(ggplot2)
library(survival)
library(survminer)
table(dat$Status)
dat$Status=ifelse(dat$Status=='Dead',1,0)
sfit <- survfit(Surv(Days, Status)~Group, data=dat)
sfit
summary(sfit)
ggsurvplot(sfit, conf.int=F, pval=TRUE)
生存分析结果如图所示:
如果用这个包里面的森林图函数需要指定模型
head(dat)
model <- coxph( Surv(Days, Status) ~ Expression + Group, data = dat )
ggforest(model, #coxph得到的Cox回归结果
data = dat, #数据集
main = 'Hazard ratio of BRCA_PTP4A3', #标题
#cpositions = c(0.05, 0.15, 0.35), #前三列距离
fontsize = 1, #字体大小
refLabel = 'reference', #相对变量的数值标签,也可改为1
noDigits = 3 #保留HR值以及95%CI的小数位数
)
由于没有获取更多的原始数据,因此得到的结果只有一个:
这里最重要的是指定这个模型
coxph
函数的定义。再返回网易工具查看相关信息:
Cox regression results for PTP4A3在不同癌症的分析结果展示,通过本次作业回顾了生存分析的数据获取及森林图相关的概念,终于有了初步的认识。