CTR-DB是由国家蛋白质科学中心(北京)李栋研究员/贺福初院士团队将临床转录组数据和临床用药响应信息结合起来,建立的首个具有临床用药响应信息的病人来源的癌症临床转录组数据资源,为基础和临床研究者提供了一个接入、整合和重利用癌症治疗响应临床转录组数据的接口,助力癌症药物抵抗机制揭示、联合药物发现以及抵抗机制异质性探索,尤其是为利用病人转录组数据发现和验证药物响应预测标志物提供了重要资源。
CTR-DB
好的,接下来看看如何使用这个数据库吧~
重要定义:
CTR-DB数据集:一个CTR-DB数据集由使用相同的治疗方案,患有相同癌症亚型的,同时来自于同一个原始数据集(source dataset)的病人样本组成。一个CTR-DB数据集中的病人具有各种原始响应状态,比如可能包括完全响应、部分响应、稳定疾病和进展疾病等各种响应状态的病人。这些病人被分成响应和不响应两个组。之后的单数据集等大部分分析都基于两组之间的差异展开。
CTR-DB数据子集:一个CTR-DB数据集会进一步被分割成CTR-DB数据子集,一个数据子集是由具有相同原始响应状态(比如完全响应或者部分响应)的病人样本组成。
Home
网站主页展示了关于CTR-DB的简介、数据统计表格和统计交互式环图,点击环图中的模块(癌症/药物分类/数据类型),可以跳转到后面“Browse”模块中相对应所选模块的筛选界面。主页下方的字段展示的是该数据库的主要功能/工作流:单数据集分析(包括非响应/响应组差异基因表达分析、基因ROC曲线分析、功能富集分析,L1000CDS2分析寻找能够逆转耐药特征的候选药物以及肿瘤微环境分析),多数据集联合分析,多数据集比较以及药物响应预测标志物验证。
Browse和单数据集分析
CTR-DB支持对CTR-DB数据集、药物、癌症类型和基因进行浏览和检索。进入“Dataset”的浏览页面,可以看到数据库中数据集的主要信息展示。页面左边是筛选栏,可以选出满足自己所需条件的数据集,筛选条件可以叠加。例如从前面home界面点击“Immunotherapy”环图模块或在browse界面的Drug type直接筛选“Immunotherapy”,都可以呈现所有免疫药物相关的数据集。
在此页面还可以选择一个或者多个感兴趣的数据集进行数据下载,数据集信息包括表达谱和临床信息,如下,当然也可以选择“Download ALL”,一键下载所有数据集的信息。
以CTR_RNAseq_197数据集为例,分析PD-1/PD-L1抑制剂治疗肺癌患者的抵抗机制。点击CTR-DB ID列蓝色字体进入数据集详情页面。即可得到数据集详细注释信息以及该数据集的单数据集分析结果。数据集详细注释信息主要包括该数据集涉及的癌症、药物、样本相关信息等。
单数据集分析结果主要分为两个部分,Result1:Resistance signature analysis部分为耐药特征分析,Result2:Tumor microenvironment analysis为肿瘤微环境分析。Result1部分可以自定义Adjusted P-value和 |logFC|进行卡值。默认展示的结果是耐药特征分析中的基因差异表达分析(DEG)结果,可以揭示药物抵抗相关重要分子,以火山图和热图形式展示,具体基因展示在下方表格。差异基因列表提供基因Gene symbol、Entrez ID,以及LogFC和AUC及其对应的P value和Adjust P value,|logFC|越大且校正P值越小则说明该基因的差异越显著,在该治疗方案响应/耐药中起的作用越大,且logFC小于0时说明该基因在响应组高表达,大于0时该基因在抵抗组高表达。此处结果显示,在不响应患者队列中PD-L1表达显著下降(即CD274,log FC = −1.15,P-value = 0.0187),即CD274基因可能是anti-PD-1/PD-L1治疗方案在肺癌中的耐药的机制分子,CD274基因低表达肺癌患者对anti-PD-1/PD-L1治疗方案耐药。点击基因名前“>”可以展开该基因在肿瘤敏感和肿瘤耐药组的表达差异箱线图和ROC曲线图,能发现区分响应和非响应病人的药物响应预测标志物。CD274对应的ROC AUC=0.783, P-value=0.00359, 表明CD274可能是肺癌中anti-PD-1/PD-L1治疗响应的预测分子标志物。
而点击基因名则可以跳转到“Browse”的Gene详细信息页面(基因详细信息界面见后“biomarker validation”部分)。
Result1部分的基因集富集分析(GSEA)结果也是以图+表的形式呈现,可以揭示药物抵抗相关的生物学过程、通路。支持6种基因集,包括KEGG、Hallmark、Reactome、WikiPathways和MicroRNA靶标及转录因子靶标。以条形图展示调整后P值递增顺序Top10上调基因集(NES>1)和Top10下调基因集(NES<-1),通常|NES|≥1和调整P值≤0.05的基因集最为显著且值得关注。下方表格提供详细信息,可以自由调整排序方式。如此处结果显示PD-L1上游的JAK-STAT通路显著下调(NES = −1.49,P-value = 2.31e−04),提示JAK-STAT通路可能在anti-PD-1/PD-L1治疗方案发生抵抗时起到重要作用。
过表达分析(ORA)结果与GSEA分析结果类似,也支持六种基因集的选择。
“L1000CDS² analysis”用于寻找可以逆转上述耐药基因表达特征的潜在药物,也即发现能够对抗药物A抵抗的联合用药A+B。使用该功能寻找能够逆转anti-PD-1/PD-L1治疗耐药信号的药物候选,结果发现在返回的前50个药物信号中,有15个是组蛋白去乙酰化酶抑制剂HDACI,这暗示HDACI是很有希望的anti-PD-1/PD-L1阻断治疗抵抗的增敏候选药物,而确实已有文献报道“HDAC抑制剂+ PD1/PD-L1阻断”组合已经使用到非小细胞肺癌的临床试验中[1]。
Result2部分用于探索与药物抵抗相关的肿瘤微环境因素。此处,作者首先基于样本表达谱,借助于ESTIMATE方法预测肿瘤细胞纯度(ESTIMATEscore)以及基质细胞和免疫细胞比例(StromalScore, ImmuneScore),借助于MCPcounter预测各类型细胞丰度。而后对响应组和非响应组的上述各指标分别进行差异分析,用以揭示与药物抵抗相关的潜在肿瘤微环境因素。结果呈现形式是热图和差异分析结果表格。在结果表格中,点击指标前“>”可以展开该微环境因素(比如某类型细胞丰度或者某个ESTIMATE打分)在肿瘤敏感和肿瘤耐药组的差异箱线图和ROC曲线图。在不响应样本中,免疫细胞的比例(“ImmuneScore ”,log FC = −0.64,P-value = 0.10),特别是CD8+ T细胞的丰度(log FC = −1.32,P-value = 0.0513)显著更低。这与差异表达基因的分析结果是一致的,因为在抗肿瘤免疫中,CD8+ T细胞是JAK-STAT信号通路上游的IFN-γ的关键来源之一,之前的DEG结果中IFN-γ表达也显著下降。至此,所有结果暗示低免疫细胞浸润,尤其是低CD8+ T细胞浸润导致IFN-γ低表达,下调INF-γ-JAK-STAT级联进而下调PD-L1可能是肺癌患者对PD-1/PD-L1抑制剂治疗抵抗的分子机制。该发现与前人研究结果一致[2]。
Browse界面的Drug版块,可以选择几种分类(化疗药物、靶向药物、免疫药物)下的具体药物名称,即可获得药物的基本信息。此处的“Dataset number”可以链接到与该药物相关的“Dataset”浏览页面。
Browse界面的Cancer版块,可以选择不同癌症分级的癌症名称,即可获得癌症的基本信息。此处的“Dataset number”可以链接到以该癌症名为筛选条件的“Dataset”浏览页面。
比较特殊的Gene浏览界面,其实就是“Biomarker validation”分析界面。输入感兴趣的基因名,点击基因名进入基因详细信息界面,即可查看基因的详细信息,以及该基因的表达与各种癌症亚型或治疗方案之间的相关性。(基因详细信息界面见后“biomarker validation”部分)
Combine
该功能允许用户任意组合CTR-DB数据子集(定义见上面所述),进而指定哪些子集组成响应组,哪些子集组成非响应组。后续分析流程同上述“单数据分析”。该功能可用于许多场景。比如1)如果用户不满意作者预先定义的响应/不响应分组规则,可以借助此功能重新定义,比如将“完全响应“、“不响应“和“稳定疾病“都认为是响应组,而疾病进展认为是不响应组,进而分析药物抵抗机制;2)用户可以联合使用相同治疗方案且具有相同癌症亚型但是来源于不同源数据集的病人样本,进而在更大的样本量上研究药物抵抗机制;3)进而还可以合并一类药物(比如PD1/PD-L1抑制剂)或者一个更粗颗粒度的癌症类型的病人样本。
左侧栏供选择感兴趣的数据集,筛选出anti-PD-1/PD-L1治疗方案相关的数据集进行演示,包含2个药物响应数据集和2个药物抵抗数据集,Original response grouping列为药物应答信息,各个缩写的含义在Help帮助文档有说明。在进行combine分析的时候,数据集选择需要遵循以下规则:1)要求响应组的至少一个样本同时不响应组中的至少一个样本是来源于同一个源数据集的,否则我们无法区分响应组和不响应组之间的不同是由不同的批次导致的还是确实是真正的生物学不同;2)RNA-seq数据集和Microarray数据集不能合并;3)成人和儿童疾病的数据集不建议合并。结果显示CD274基因在这个更大的anti-PD-1/PD-L1合并数据集上也在不响应患者队列显著下调(logFC<0),这与之前的单数据集分析结论一致。所支持的其他数据分析功能同上述单数据集分析功能一致,结论也一致,此处不做赘述。
Compare
用以比较用户选择的多个CTR-DB数据集的单数据集分析结果并进行荟萃分析,探索不同数据集抵抗机制的同质性/异质同,甚至发现可能的“泛数据集”共享的抵抗机制和预测标志物。该功能仅限于样本量在10以上且药物响应和不响应样本数各大于1的CTR-DB数据集,要求选择至少2个CTR-DB数据集。
左侧栏供选择感兴趣的数据集,以三个抗PD1/PD-L1治疗相关数据集的比较为例,结果界面包括所选择的CTR-DB数据集的基本信息以及五个比较分析结果,包括基因表达差异分析("Gene logFC")、基因 ROC 曲线分析("Gene AUC")、肿瘤微环境(TME)指标差异分析("Tumor microenvironment logFC")、TME 指标ROC 曲线分析("Tumor microenvironment AUC")以及 KEGG 通路富集分析("KEGG NES")。每项分析结果下都提供了详细的结果比较表和热图。例如结果Tumor microenvironment AUC部分,结果中较小的meta-P值预示可能潜在的“泛数据集”耐药机制。与响应样本相比,CTR_RNAseq_179中不响应的转移性黑色素瘤患者的免疫细胞浸润程度略高(“ImmuneScore”,log FC = 0.11,P-value = 0.76;CD8+ T细胞,log FC = 0.99, P-value = 0.36,NK细胞,log FC = 0.38, P-value = 0.53),这些结果暗示CTR_RNAseq_179中不响应患者具有与上述CTR_RNAseq_197明显不同的药物抵抗机制。
Biomarker validation
如前所述,“Biomarker validation”分析界面可以链接Gene浏览界面。以输入基因“CD274”为例,可以查看该基因在各个CTR-DB数据集中的(非响应组vs响应组)差异表达情况(logFC and P-value)以及ROC曲线下面积(ROC AUC and P-value)。ROC AUC可以衡量该基因的表达区分响应组vs非响应组的能力。因此该功能可以帮助查看该基因的表达在各个病人群体(即使用不同药物、不同癌症亚型、不同来源的CTR-DB数据集)上区分响应、不响应病人的能力。如此处展示CD274作为肿瘤耐药生物标志物的探索性分析结果,提示肺癌中CD274基因在响应组中表达量高而不响应组中表达量低,说明其可以作为anti-PD-1/PD-L1治疗方案耐药的biomarker,即CD274低表达肺癌患者对anti-PD-1/PD-L1治疗方案耐药。
PS: 本教程还有不够详尽之处可以前往网页“Help”界面,或点击所在界面的问号标识符进行查看。网站上所有分析界面的结果都支持下载。
CTR-DB数据库充足的数据资源以及各项分析功能,为我们探索耐药机制、寻找耐药生物标志物、以及药物组合分析和耐药机制异质性等研究提供极大便利。希望大家使用愉快~最后,大家使用时别忘记引用哦↓
Liu Z, Liu J, Liu X, Wang X, Xie Q, Zhang X, Kong X, He M, Yang Y, Deng X, Yang L, Qi Y, Li J, Liu Y, Yuan L, Diao L, He F, Li D. CTR-DB, an omnibus for patient-derived gene expression signatures correlated with cancer drug response. Nucleic Acids Res. 2022 Jan 7;50(D1):D1184-D1199. doi: 10.1093/nar/gkab860. PMID: 34570230; PMCID: PMC8728209.
[1] Gray JE, Saltos A, Tanvetyanon T, Haura EB, Creelan B, Antonia SJ, Shafique M, Zheng H, Dai W, Saller JJ at al. Phase I/Ib Study of Pembrolizumab Plus Vorinostat in Advanced/Metastatic Non-Small Cell Lung Cancer. Clin Cancer Res. 2019 Nov 15;25(22):6623-6632. doi: 10.1158/1078-0432.CCR-19-1305. PMID: 31409616; PMCID: PMC7234799.
[2] Lei Q, Wang D, Sun K, Wang L, Zhang Y. Resistance Mechanisms of Anti-PD1/PDL1 Therapy in Solid Tumors. Front Cell Dev Biol. 2020 Jul 21;8:672. doi: 10.3389/fcell.2020.00672. PMID: 32793604; PMCID: PMC7385189.