Cisplatin resistance-related multi-omics differences and the establishment of machine learning models
顺铂耐药性相关的多组学差异和机器学习模型的建立
发表期刊:J Transl Med
发表日期:2022 Apr 11
DOI: 10.1186/s12967-022-03372-0
一、背景
顺铂是由M. Peyrone在1844年首次合成的,其化学结构在1893年由Alfred Werner首次阐明。然而,该化合物直到20世纪60年代才得到充分的科学调查,当时罗森伯格发现它能够抑制大肠杆菌的细胞分裂,这增加了它用于癌症化疗的可能性。1978年,顺铂成为FDA批准的第一个用于癌症治疗的铂类化合物,后来它成为最重要的抗癌药物之一。
对于其药理机制,一般来说,它们会损伤DNA,导致细胞周期停滞和细胞死亡,通常是通过细胞凋亡。然而,副作用和耐药性是顺铂的两个固有挑战,限制了其应用和效果。在许多常见的肿瘤类型中,如NSCLC,基于铂类的DNA损伤剂的疗效是有限的,导致只有约三分之一的患者得到好处。
二、材料与方法
1.数据来源
(1)细胞系的详细信息从Cancer Dependency Map和CCLE下载,包括IC50值、细胞系来源、体细胞突变、mRNA表达、miRNA表达和代谢物
(2)从TCGA中下载了用顺铂治疗的肺腺癌患者的信息(TCGA-LUAD),以及他们的基因表达数据
(3)NSCLC A549和H358细胞来自美国类型培养集
2.实验流程
(1)差异分析:对低IC50组和高IC50组之间的体细胞突变、RNA、miRNA和代谢物数据进行了差异分析
(2)GO、KEGG和GSVA分析:研究与铂反应明显相关的蛋白质的生物学意义
(3)模型:根据LASSO的结果,采用Logistic回归、分类和回归树(CART)以及C4.5决策树分类算法,利用发生率来确定因变量的类别;使用逐步回归法选择变量
(4)细胞培养和细胞毒性试验、RNA干扰、RNA制备和qRT-PCR分析、Western blot分析
(5)单一肿瘤和免疫细胞:使用与先前研究中描述的相同方法来测试顺铂敏感性相关基因
三、实验结果
1.顺铂细胞IC50值的分组和概述
最终有661个细胞系入选,并有完整的mRNA、microRNA表达和代谢物的数据。根据CCLE数据库给出的反映对化疗药物敏感性的IC50值,即半数抑制浓度,将它们分为3组。该值越低,敏感性越强。在本研究中,将前1/3(220个)的低IC50值(IC50≤10.4)定义为敏感组,后1/3(220个)的低IC50值(IC50≥26.2)被纳入非敏感组(图1)。
显然,对顺铂的耐药性在不同的癌症中是不同的。在Depmap数据库中,作者成功地根据癌症来源对不同的肿瘤细胞系进行分类,从而得到相关癌症的顺铂的平均IC50值。图S1显示,有6种癌症的平均IC50值超过100,包括肺腺癌(LUAD)、间皮瘤(MESO)、甲状腺癌(THCA)等,这意味着这些类型的癌症患者对顺铂这种最常见的化疗药物产生耐药的可能性较大。
2.体细胞突变差异
将体细胞突变数据与药物敏感性数据相匹配后,研究了低IC50和高IC50组之间体细胞突变特征的差异。如图2A和B所示,虽然两个体细胞突变的瀑布图和这些基因的共存集在一定程度上是相似的,但不难发现,在顺铂耐药组(高IC50)中,TP53的突变排在第一位(10%),高于顺铂敏感组(低IC50组)的突变率。正如以前所报道的,TP53突变只出现在顺铂耐药的肿瘤中,特别是在原发性纵隔非血清肿瘤中。因此可以得出结论,TP53突变与顺铂耐药密切相关。相反,MUT5在低IC50组有较高的突变率。作者还检查了用"drugInteractions "功能从药物基因相互作用数据库中编译的药物-基因相互作用,大多数药物都与TTN和TP53有关,这在两组细胞中差异较小。
3.不同水平基因功能分析的差异分析
为了进一步研究两组细胞之间的差异,作者从不同层面对两组细胞系进行了差异性分析。首先,在mRNA水平,发现1348个mRNA在两组间有差异表达,其中顺铂耐药组有1个下调(SLFN1),35个上调(TMEM4SB、CLDN3、KLK6、IRF5、ZBTB38等)(图3A)。同样,在miRNA水平上,如图3B所示,发现80个差异表达的miRNA,11个下调(miR-194、miR-206、miR-215等),12个上调(miR-144、miR-16、miR-129-3p等)。然而,对于代谢物,只有15种代谢物,如尿素、丝氨酸、肌肽、N-氨基甲酰-β-丙氨酸、胱硫醚等的表达在两组之间有明显的差异(图3C)。在甲基化方面,没有一个差异甲基化位点与差异表达的基因密切相关(图3D)。
作者首先根据CCLE数据对之前发现的1348个差异表达的mRNAs进行了GO分析。基因功能富集分析显示,20个GO功能组在低IC50组和高IC50组之间表现出明显的差异,包括肌动蛋白结合、细胞外基质结构成分、GTP酶结合、鸟嘌呤核苷酸交换因子活性等(图5A)。对于基于这些mRNAs的KEGG(图5B),两组之间有10条路径不同。PI3K-Akt信号通路,差异最明显,基因比例最高,其次是癌症中的蛋白多糖,焦点粘附等。 接下来,为了进一步总结通路和功能的差异,使用GSVA总共总结出643条基因通路图(图5C),其中大部分与耐药有关,包括瑞金他莫昔芬耐药、EGFR信号24HR、吉非替尼耐药、KIM-MIC扩增靶点等。
4.模型构建和评估
首先,应用glmnet R软件包,以确定DEGs与IC 50高或低有关。在1348个mRNA中选出6个FOXA2、BATF3、SIX1、HOXA1、ZBTB38、IRF5作为顺铂耐药性的相关特征(图4A,B),然后建立相关的logistic模型(图4C)。
接下来获得了IC50的预测值,阶梯函数被用来实现逐步回归。从结果中可以发现,6个变量中有3个通过了显著性检验,成为构建模型的相对重要的变量。虽然模型中的每个变量都通过了显著性检验,但有必要确保整个模型是显著的。因此,对该模型进行了Chi-Squared检验。随着这些变量从第一个到最后一个逐一加入到模型中,模型最终通过了显著性检验,表明由这些变量组成的模型是有意义和正确的。
最后,检验了这些基因是否不仅与顺铂耐药性有关,而且与患者的生存期也有联系。此外,根据TCGA数据库的数据,它们的表达水平与不同肿瘤患者的预后有一定关系,包括乳腺癌、卵巢癌、肺癌和胃癌等(图5)。事实上,BATF3、IRF5和ZBTB38也有助于评估乳腺癌和卵巢癌患者的化疗反应。
同样地,作者建立了miRNA预测模型。从LASSO回归中,得出4个重要的miRNA,miR-203、miR-200c、miR-148a和miR-142-5p。经过阶梯函数,剩下miR-203和miR-200c,它们都通过了Chi-Squared检验的显著性检验,表明由这些变量组成的模型是有意义且正确的。
5.BATF3、IRF5、ZBTB38的表达与A549和H358细胞及肿瘤样本中顺铂的敏感性有关
为了检验在细胞水平上BATF3、IRF5、ZBTB38的表达与顺铂敏感性的因果关系,人类癌症细胞系A549和H358(非小细胞肺癌)中分别转染BATF3靶向、IRF5靶向和ZBTB38靶向的siRNA。所有的siRNA介导的沉默被证明是高效的,并能维持3天或更长时间。与模拟沉默细胞相比,IRF5 和 ZBTB38 沉默细胞对顺铂的敏感性至少降低,而 BATF3 沉默细胞对顺铂的敏感性增加(图6A, B)。
共选取6例接受完全顺铂新辅助化疗的食管鳞状细胞癌(ESCC)患者,其中新辅助化疗不敏感(NACT-NON-SEN)肿瘤样本4例,新辅助化疗敏感(NACT-SEN)肿瘤样本2例(图7A)。采用RECIST标准评价NACT效应的有效性。同样,选择了5名LUAD患者,其中3名是NACT-SEN(3名CR,1名PR),2名是NACT-NON-SEN(图7B)。
在LUAD中,BATF3在NACT-SEN组中显着下调,而NRAT-SEN组中IRF5,ZBTB38在恶性上皮细胞簇中的表达显著高于NACT-NON-SEN组(用EPCAM和SOX4标记(图7)。在ESCC中,BATF3,IRF5,ZBTB38在LYZ和C1QB标记的9801个恶性细胞中表现出相同的趋势(图7C)。
四、结论
体细胞突变、mRNA表达、miRNA表达和代谢物的差异都与顺铂耐药性有关。作者建立的基于BATF3、IRF5、ZBTB38三个基因表达的模型,可以帮助预测接受铂类药物,特别是包括顺铂在内的化疗药物的癌症患者的反应和预后。