用好数据库,文章发到吐!
最近新发现了一个数据库CTR-DB (Cancer Treatment Response gene signature DataBase),重点关注癌症药物抵抗,数据类型丰富,功能实用且小白易上手,这么好用的数据库居然沉寂了一年多!大数据请把它推给需要的人OK?
癌症药物抵抗一直以来都是癌症药物治疗面临的巨大挑战,癌症耐药机制揭示、用药响应预测标志物发现也是备受追捧的热门话题,这周便给大家介绍一款病人来源的癌症药物响应相关基因表达谱数据库,CTR-DB数据库助力你的癌症耐药研究和标志物发现,一起来看看吧~!
CTR-DB数据库简介:
CTR-DB数据库(http://ctrdb.ncpsb.org.cn/home)于2022年1月份发布在Nucleic Acids Research杂志上,是首个收录病人来源的具有用药响应信息的临床转录组数据的数据资源和分析平台。
CTR-DB共含有626个具有病人用药响应信息的临床转录组数据集,涉及28种组织学癌症类型、275种用药方案和5139个患者样本。所有转录组数据从raw data开始进行了标准化的重处理,相关术语进行了标准化。除了基本的数据浏览、检索和下载,数据库支持单数据集分析(包括响应组和非响应组的差异基因表达分析、基因的ROC曲线分析、功能富集分析、联合用药发现和肿瘤微环境分析)、多数据集联合和比较分析以及标志物验证等功能,为耐药机制揭示(包括肿瘤微环境相关耐药机制)、用药响应预测标志物发现和验证、耐药机制异质性探索等研究提供极大便利。
重要定义:
CTR-DB数据集:一个CTR-DB数据集由使用相同的治疗方案,患有相同癌症亚型的,同时来自于同一个原始数据集(source dataset)的病人样本组成。一个CTR-DB数据集中的病人具有各种原始响应状态,比如可能包括完全响应、部分响应、稳定疾病和进展疾病等各种响应状态的病人。这些病人被分成响应和不响应两个组。之后的单数据集等大部分分析都基于两组之间的差异展开。
CTR-DB数据子集:一个CTR-DB数据集会进一步被分割成CTR-DB数据子集,一个数据子集是由具有相同原始响应状态(比如完全响应或者部分响应)的病人样本组成。
数据库核心功能及操作演示:
Browse
CTR-DB支持对CTR-DB数据集、药物、癌症类型和基因进行浏览和检索,也支持数据集下载(包括表达谱和药物响应等临床信息)。
在数据集浏览界面,可以通过左侧筛选栏选出满足自己所需条件的数据集。在此页面还可以选择一个或者多个感兴趣的数据集进行数据下载。点击浏览表格中的数据集ID将进一步进入数据集详细注释页面,在详细注释页面上,除了关于数据集的详细注释信息之外,还将展示单数据集分析结果。
单数据集分析
以第一个数据集CTR_Microarray_48为例,点击数据集编号可以进入到该数据集的详细注释页面及分析结果页面。单数据集分析结果主要分两方面:
药物抵抗信号分析: 包括非响应/响应组差异基因表达分析(揭示药物抵抗相关重要分子)、基因的ROC曲线分析(发现能够区分响应和非响应病人的药物响应预测标志物)和功能富集分析(揭示药物抵抗相关的生物学过程、通路),另外还可以使用L1000CDS2分析基于来源于CMAP/LINCS的药物扰动信号来寻找能够逆转药物抵抗特征(获得自上面提到的非响应组/响应组的差异基因表达分析)的候选药物,也即发现能够对抗药物A抵抗的联合用药A+B。
肿瘤微环境(TME)分析: 用于探索与药物抵抗相关的肿瘤微环境因素。
Combine
该功能允许用户任意组合CTR-DB数据子集(定义见上面所述),进而指定哪些子集组成响应组,哪些子集组成非响应组。后续分析流程同上述“单数据分析”。
该功能相当灵活,可用于许多场景。比如1)如果用户不满意作者预先定义的响应/不响应分组规则,可以借助此功能重新定义,比如将“完全响应“、“不响应“和“稳定疾病“都认为是响应组,而疾病进展认为是不响应组,进而分析药物抵抗机制;2)用户可以联合使用相同治疗方案且具有相同癌症亚型但是来源于不同源数据集的病人样本,进而在更大的样本量上研究药物抵抗机制;3)进而还可以合并一类药物(比如PD1/PD-L1抑制剂)或者一个更粗颗粒度的癌症类型的病人样本。
Compare
用以比较用户选择的多个CTR-DB数据集的单数据集分析结果并进行荟萃分析,用以探索不同数据集抵抗机制的同质性/异质同,甚至发现可能的“泛数据集”共享的抵抗机制和预测标志物。
结果页面如下图所示,包括所选择的CTR-DB数据集的基本信息以及五个被比较的分析结果,分别是“Gene logFC” “Gene AUC”, “Tumor microenvironment logFC”, “Tumor microenvironment AUC”, 和 “KEGG NES”,每项分析结果下都提供了详细的结果比较表和热图。
Biomarker validation
输入感兴趣的基因名,用户可以查看该基因在各个CTR-DB数据集中的(非响应组vs响应组)差异表达情况(logFC and P-value)以及ROC曲线下面积(ROC AUC and P-value)。ROC AUC可以衡量该基因的表达区分响应组vs非响应组的能力。因此该功能可以帮助查看该基因的表达在各个病人群体(即使用不同药物、不同癌症亚型、不同来源的CTR-DB数据集)上区分响应、不响应病人的能力。
以输入基因“CD274”为例,可以查看到该基因的基本信息以及其在各个数据集上的logFC和ROC AUC.
同时在菜单栏help部分也提供了数据库介绍和使用指南,可供大家随时查阅,即使是不会生信分析的小白也能迅速上手,查阅到感兴趣的数据和得到想要的分析结果。
数据库具体场景的应用:
观察了一下截至目前为止引用CTR-DB数据库的文章,发现其在这些文章中的角色及作用是:1)面向生信研究:CTR-DB作为病人来源的癌症用药响应转录组数据资源,为构建癌症药物响应预测模型提供基础数据以及验证数据集。所以CTR-DB数据可以下载;2)利用该数据库的biomarker validation功能对感兴趣的基因进行初步的生信分析确定该基因的功能意义,检查其与各种癌症亚型和药物耐药性的相关性,进一步设计后续实验并进行验证;3)对于有细胞系水平等证据支持的候选药物响应预测生物标志物,使用相应的CTR-DB患者队列转录组验证其预测能力。
CTR-DB所收录的独一无二的数据以及丰富的数据分析功能为临床和基础研究者提供了一个研究癌症精准治疗的一个宝贵资源。
以上就是CTR-DB数据库全部内容,开发并维护数据库不易,小伙伴们使用时别忘记引用以下文献哦~!
Liu Z, Liu J, Liu X, Wang X, Xie Q, Zhang X, Kong X, He M, Yang Y, Deng X, Yang L, Qi Y, Li J, Liu Y, Yuan L, Diao L, He F, Li D. CTR-DB, an omnibus for patient-derived gene expression signatures correlated with cancer drug response. Nucleic Acids Res. 2022 Jan 7;50(D1):D1184-D1199. doi: 10.1093/nar/gkab860. PMID: 34570230; PMCID: PMC8728209.