#2020.2.3 R语言|Practice3
今日学习内容一览
一、Jimmy 生信技能树B站P10-P13(课上积累)
二、今日学徒任务(待续)
三、TCGA数据的差异分析学习
二、今日学徒任务(已完成差异分析和生存分析)
-
使用网页工具UCSC Xena下载TCGA数据并制作差异分析箱线图
使用原始数据点击网页上的差异分析图标进行制作:
去掉Metastatic和Recurrent Tumor两个不相干的类型得到:
- 使用网页工具UCSC Xena进行生存分析
Launch Xena
-
Search for a study
(填写相应感兴趣的癌症类型:TCGA Colon and Rectal Cancer (COADREAD))
-
First variable(筛选变量1)
Select Phenotypic- sample_type
Add gene
(在输入框中填写相应感兴趣的基因:APOC1)
Select Genomic-gene expression RNAseq-illuminaHiSeq
经历三个ABC筛选块后可以得到如下图所示界面:
因为对于生存分析我们只关心Primary Tumor病例样本,所以我们需要把其他类型都过滤掉。
筛选前,一共有736个样本:
第一次筛选——!=null
第一次筛选后,还剩434个样本:
第二次筛选:!=Recurrent Tumor
第二次筛选后,还剩380个样本:
和筛选前相比 可以看到sample_type只剩下Primary Tumor
使用此时的数据绘制生存分析
OS(Overall survival)
DFI(Disease free interval)
- 使用网页工具Oncolnc绘制生存分析(KM)图表
- 首先选择感兴趣的基因
- 其次选择感兴趣的癌症
- 填写高表达量和低表达量的相应百分比
-
得到生存分析图: