02准备
- Perl处理文本内容强大;用R画图
- R路径千万不要有英文和空格
03数据下载
- 推荐使用UCSC Xena下载
- GDC TCGA数据下载,基因表达选择FPKM,临床数据和生存数据
- 表达数据可以下载表达矩阵
- 所有肿瘤都是下载这三个数据
- 免疫亚型数据
- 干细胞打分数据
TCGA有两套数据,GDC与官网最接近(转录组,临床,生存在这儿下载),下面的TCGA才有样品的免疫亚型与干细胞打分(pan-cancer,Immune Model,下载表格;干细胞指数,DNA甲基化与RNA数据的两个表格)
04id转换
- 表达数据id转换
- ensemble id转化为基因名称
- 其他盘运行Perl脚本先进入磁盘,运行完一个就会出现一个文本文件
05提取目标基因
- 把目标基因名称放进去得到基因列表
- 输入文件为symbol.txt
06泛癌基因表达水平
绘制箱线图,查看泛癌肿瘤样品当中的基因表达水平
07泛癌差异分析
基因在哪些肿瘤里面是具有差异的
08泛癌差异分析热图
- 横坐标基因,纵坐标肿瘤
- 输入文件为泛癌基因表达文件
- 对肿瘤进行循环
-
检验方法是wilcox检验,非参检验
13免疫亚型分析
- 表达输入文件
- 免疫分型文件
16肿瘤干细胞相关性RNAss
- 基于表达数据计算的干细胞相关性打分
- 相关性图形不一样的,这个是以小球的蓝色和红色为标准的
- 打分越高说明干细胞含量越多,肿瘤分化程度越低
17肿瘤干细胞相关性DNAss
- 基于甲基化数据得到的干细胞指数
- 依旧是多基因的和肿瘤的