cBioPortal数据库是一个包含TCGA和ICGC等大型的肿瘤研究项目,并整合癌症基因数据和临床数据的国际公共数据库,其整合的基因组数据类型包括体细胞突变、DNA 拷贝数改变 (CNA)、mRNA 和 microRNA (miRNA) 表达、DNA 甲基化、蛋白质丰度和磷蛋白丰度。cBioPortal可以进行多种分析,但最主要的还是与突变相关的各种分析及其可视化,其不仅支持单基因单癌症的查询,而且可以进行多基因单癌症、单基因多癌症、多基因多癌症,甚至是跨癌症基因组项目的分析。此外,cBioPortal数据库还支持生物通路探索、生存分析、基因组改变之间的互斥性分析、选择性数据下载、程序化访问和出版质量摘要可视化。
注意:cBioPortal已包装到R包里,对应"cgdsr"包
Step1: 页面介绍(选择癌种)
1)在最左边选择想要组织(eg. Lung);
2)在中间框选择具体的研究(eg. "Lung Adenocarcinoma (TCGA, PanCancer Atlas)");
3)点击下方"Query By Gene"。
Step2: 选择需要分析的数据类型,样本及基因等
1)选择需要分析的数据类型;
2)选择样本;
3)在“Enter Genes”里面输入感兴趣的基因(若网站报了错“Invalid gene symbols”,应注意,基因是否有别名)
4)最后,点击“Submit Query”即可开始分析
Step3: 结果展示
cBioPortal包含了多组学研究中能够实现的所有分析功能,包括OncoPrint(基因突变图谱)、Cancer Types Summary(泛癌种基因突变汇总)、Plots(分析拷贝数变异与基因突变或者基因表达的相关性)、Mutations(基因突变列表、功能及蛋白3D结构)、Co-expression(基因共表达分析)、Enrichments(基因突变互作/互斥分析)、Survival(生存分析)、CN Segments(拷贝数分析)、Network(共表达网络)等多种分析结果。点击不同的模块,即可查看各种分析的结果,并且还能根据需要进行一定程度的个性化调整。
3.1:
★ 以热图的形式展现样本中mutations和CNAs的分布情况
★ 自定义可视化结果,可进行缩小放大,取消勾选view下"show unaltered cases"移除无改变cases,取消勾选view下"show whitespace between columns"移除samples之间空白,再通过Sort更改结果排序。
3.2:
★ 以堆积柱状图的形式,展示mutations和CNAs的构成
3.3:
★ 将一个基因上存在变异的样本个数作为一个集合,通过对两个基因对应的集合进行分析,来分析两个基因在肿瘤中的是互斥还是共发生,提供p值及校正后p值(q值),可下载或复制表格。
3.4:
★ Plot提供可视化结果,可选择不同数据类型,选择目标基因,左边栏可设置横、纵坐标轴参数,分析拷贝数变异、基因突变、基因表达之间的的相关性
★ ShallowDel ,Gain 和Diploid 都是对拷贝数变异(CNA)的描述:
1) 人是二倍体,Diploid 就是二倍体的意思,就是这个位置没有拷贝数变异。
2) ShallowDel : 指拷贝数的轻度丢失,是shallow 和deletion 的组合,你可以理解为本来是二倍体的变成一倍体了(一般以log2Ratio的值去界定的)。
3) Gain: 轻度的拷贝数扩增,你可以理解为本来是二倍体的变成三倍体了。
分析拷贝数变异与基因突变或者基因表达的相关性
3.5:
★ 展示目标基因对应蛋白质的二维结构图,提供各个基因突变位点和频率信息,右侧栏显示Refseq、Ensembl、CCDS和Uniprot数据库链接
★ 左侧,Add annotation tracks可自定义表格,显示肿瘤相关热门位点(Cancer Hotspots)和蛋白翻译后修饰位点(PTM sites)信息
★ 右侧,3D Structure可查看蛋白三维结构图,PDB Chains可选择想要查看的肽链三维结构和具体信息
★ 下方,表格显示所有非同义突变详细信息,Columns菜单提供以下信息:样本ID链接,氨基酸变化,突变类型(错义突变,无义突变,剪接位点,移码,插入或缺失等);预测的错义突变功能;链接到突出显示突变的3D结构;突变状态;验证状态;肿瘤等位基因突变频率;匹配正常样本等位基因突变频率;确切基因组位置信息(染色体,起始和终止位点等);受影响的同工型信息等,可以根据需要进行排序和过滤。
3.6:
★ 提供该肿瘤数据集中目标基因与其他基因共表达情况,上方栏选择目标基因,下方列表可选择其他基因,右侧显示相关性点图及统计分析结果
3.7:
★ 结合临床信息和多组学数据,根据目标基因或有无基因组改变将样本进行分组比较并根据功能不同进行不同的分析。
★ Overlop查看分组信息;
1) Altered group为至少一个基因变化的样本数
2) Unaltered group为未发生变化的样本数
★ Survival查看总生存(OS)、无病生存(DFS)和无进展生存(PFS)分析结果
★ Clinical显示临床信息基线资料表,以及对应的点图
★ Genomic Alterations以火山图和分组柱形图形式展示在不同分组中发生高频改变的基因,将鼠标放置在火山图对应散点或是柱形图上会显示对应基因信息。
★ mRNA、Protein、Methylation、Microbiome Signature数据的分组比较同样会以火山图形式展现
3.8:
★ 提供基因拷贝数信息,鼠标悬停可查看染色体位置、起始位点、样本编号等信息
3.9:
★ 根据目标基因找到匹配的癌症相关通路,并绘制通路图(支持自行拖拽调整)。
★ 除了PathwayMapper,还可以选择来源于NDEx的pathway信息,可按照Similarity、p-Value或Overlap进行排序
3.10:
★ 显示该研究下该癌症所有类型可用数据,按需下载,结合其它工具进一步分析