欢迎关注”生信修炼手册”!
GEPIA整合了来自TCGA和GTEx项目中的基因表达谱数据,提供了多种数据分析和可视化功能,操作简单,方便广大科研人员对肿瘤的表达谱数据进行挖掘,对应的文章发表在Nucleic Acids Research,链接如下
https://academic.oup.com/nar/article/45/W1/W98/3605636
该web平台的网址如下
http://gepia.cancer-pku.cn/index.html
通过首页的检索框,可以快速检索单个基因的相关结果
以TP53
为例,结果如下
1. General
这部分对基因的功能进行了简单描述,同时给出相关数据库的链接,示意如下
右侧的body map中红色代表肿瘤患者, 绿色代表正常个体,给出了在不同组织中的表达量,颜色越深,对应的表达量越高,鼠标点击可以看到具体的表达量。
还给出了不同肿瘤中正常样本和肿瘤样本中表达量的对比图,每个点代表一个样本,如下所示
还有柱状图,取了所有样本的平均值,示意如下
无论是哪种可视化方式,都是用于直观的查看肿瘤和正常个体间该基因表达量的差异。
2. Differential Genes
该部分分析在特定肿瘤中正常样本和肿瘤样本中的差异表达基因,可以自己定义差异基因分析的算法和对应的阈值,示意如下
点击List
查看差异基因对应的表格数据,示意如下
点击Plot
显示差异基因在各个染色体上的分布,示意如下
3. Expression DIY
这部分自己选择感兴趣的肿瘤,查看该基因的表达量在多种肿瘤中的分布,提供了dotplot, boxplot, viovlin plot等展现形式,示意如下
如果输入多个基因列表,还可以以热图的形式进行可视化,示意如下
T
代表tumor, N
代表normal, 对多种肿瘤中肿瘤患者和正常样本的表达量进行了可视化。
4. Survival
这部分进行生存分析,可以绘制如下所示的生存曲线
还可以分析与生存状态相关的差异基因,结果如下所示
5. Correlation
这部分用于分析两个基因间的相关性,可以自己挑选样本,指定相关系数的算法,结果如下所示
6. PCA
这部分进行PCA分析,指定多组样本,然后根据输入的基因的表达量进行PCA分析,可以生成2D和3D PCA的图,结果如下所示
其核心的差异分析和生存分析等功能,已经可以满足绝大多数TCGA数据挖掘的需求,多种可视化结果更是锦上提花。如果只是对肿瘤的表达谱数据进行挖掘,GEPIA可以称得上是最简便的平台。
·end·
—如果喜欢,快分享给你的朋友们吧—
扫描关注微信号,更多精彩内容等着你!