1. 文献关键信息
发表杂志名称(英文名):Journal of Translational Medicine
影响因子:6.1
online 时间:2025 年 1 月 8 日
2. 研究概述
本研究旨在探究人工甜味剂(AS)与癌症风险的关系。研究人员筛选 7 种常用 AS 相关靶点及癌症相关靶点,确定了 368 个 AS - 癌症交集靶点、48 个显著靶点和 35 个核心靶点。经分析,这些靶点参与细胞增殖、凋亡调控等生物学过程及多种癌症相关信号通路,且 AS 与核心靶点存在相互作用。研究发现核心靶点在 33 种癌症中的表达存在差异,部分核心靶点与肾癌、低级别胶质瘤、乳腺癌和前列腺癌密切相关。通过构建预后模型和利用 HPA 数据库验证,证实 AS 可能通过多靶点和信号通路增加上述四种癌症的风险。本研究为食品添加剂安全性评估和癌症风险评估提供参考,建议加强监管并减少 AS 摄入。
3. 研究结果
图 2 人工甜味剂 - 癌症靶点的获取结果
从多个数据库收集 7 种常用人工甜味剂(阿斯巴甜、安赛蜜、三氯蔗糖、NHDC、甜蜜素、纽甜、糖精)的靶点信息(图 2C、2D),得到阿斯巴甜有 1039 个靶点、安赛蜜 633 个、三氯蔗糖 686 个、NHDC 710 个、甜蜜素 708 个、纽甜 864 个、糖精 703 个,合并后共 2666 个 AS 靶点。从 GeneCards、TTD 和 OMIM 数据库筛选出 1268 个癌症相关靶点(图 2E)。经交集分析,确定了 368 个 AS - 癌症交集靶点(图 2F)。该图清晰展示了研究中关键靶点数据的来源和筛选成果,为后续研究提供了基础数据支撑。
图 3 AS - 癌症核心靶点的获取结果
将 48 个显著的 AS - 癌症靶点与 KEGG 数据库中 “癌症通路”(map05200)的 325 个基因进行交集分析,得到 35 个核心 AS - 癌症靶点。利用 Cytoscape 3.9.0 软件构建了 AS - 核心靶点 - 癌症网络(图 3A),图中粉色八角形代表 AS,绿色三角形表示 7 种常用 AS,橙色钻石代表癌症,紫色圆圈表示 35 个核心靶点,蓝色线条展示它们之间的关系。同时构建的核心靶点 PPI 网络中,核心靶点按 Degree 值排序,颜色越深、圆圈越大表示 Degree 值越高,靶点间相互作用越强(图 3B)。此图直观呈现了核心靶点的筛选过程及它们与 AS 和癌症之间的关联,有助于理解核心靶点在后续研究中的作用机制。
图 4 AS - 癌症核心靶点的 GO 和 KEGG 富集分析结果
对 35 个 AS - 癌症核心靶点进行 GO 和 KEGG 富集分析。在 GO 分析方面,通过 DAVID 数据库得到 342 个富集的 GO - BP(生物学过程)、37 个 GO - CC(细胞组成)和 84 个 GO - MF(分子功能)术语。选取前 10 个最显著的术语生成 GO 柱状图(图 4A),结果显示核心靶点在生物学过程中主要参与细胞凋亡的负调控、细胞增殖的正调控、对外源物质刺激的响应以及表皮生长因子受体信号通路;在细胞组成上主要位于细胞质和细胞核;分子功能方面主要涉及酶结合。KEGG 富集分析确定了 150 条信号通路,通过 KEGG 通路弦图展示前 10 个最显著的通路(图 4B),发现与核心靶点相关的通路包括癌症通路、前列腺癌、慢性髓细胞白血病、胰腺癌、结直肠癌、胶质瘤以及 PI3K - Akt 信号通路等。这些结果揭示了核心靶点在生物学功能和相关信号通路方面的重要作用,为理解 AS 致癌机制提供了理论依据。
图 5 AS 与 AS - 癌症核心靶点的分子对接结果
基于 35 个核心蛋白靶点与 7 种 AS 分子进行分子对接,根据对接结合能数据生成多轴气泡热图(图 5A),图中不同颜色圆圈代表不同 AS 分子,圆圈大小与结合能数值相关。从对接结果中选取 8 组结合能较低的组合进行展示,如 CASP3 - 三氯蔗糖、CCND1 - 阿斯巴甜等。通过 2D 和 3D 结构可视化,展示了各组合中 AS 与靶蛋白的相互作用情况,例如阿斯巴甜与 CCND1 蛋白的 7 个氨基酸残基(MET - 52、SER - 56 等)形成 9 个氢键,结合能为 - 6.8 kcal/mol(图 5B)。这些结果表明多种 AS 与核心靶点之间存在较强相互作用,为研究 AS 与靶点的结合机制提供了重要线索。
图 6 分子动力学模拟结果
对 MAPK1 - NHDC、CDK4 - 甜蜜素等复合物进行分子动力学模拟,计算 RMSD(均方根偏差)、RMSF(均方根波动)和 Rg(回转半径)等参数。结果显示,MAPK1 - NHDC 和 CDK4 - 甜蜜素复合物在 50 ns 后达到稳定,RMSF 曲线显示 MAPK1 和 CDK4 蛋白的结构域稳定,Rg 曲线表明复合物结构紧凑(图 6A - 6F)。MAPK1 - 安赛蜜、KRAS - 纽甜和 KRAS - 糖精复合物在 100 ns 后达到稳定。然而,BCL2 - 阿斯巴甜和 CASP3 - 三氯蔗糖复合物在 200 ns 内不稳定。这些结果从动态角度验证了部分 AS 与核心靶点结合的稳定性,为进一步研究 AS 与靶点的相互作用提供了动态证据。
图 7 AS - 癌症核心靶点的泛癌分析表达差异热图结果
从 GEPIA2 数据库获取 35 个 AS - 癌症核心靶点在 33 种癌症中的表达数据,并在 CNSknowall 网站生成热图(图 7)。热图结果显示,HSP90AA1 在所有癌症中均呈现高表达,而 EGF 的表达水平在所有癌症中相对较低。该热图直观呈现了核心靶点在不同癌症中的表达差异,为研究核心靶点在不同癌症中的作用提供了重要的表达谱依据。
图 8 AS - 癌症核心靶点的单变量 Cox 回归分析结果
在 SangerBox 网站对 35 个 AS - 癌症核心靶点进行单变量 Cox 回归分析,得到 35 组森林图和差异数据,在 CNSknowall 网站生成热图展示核心靶点的差异表达情况(图 8A)。热图显示在 “LGG” 和 “KIRC” 等癌症中核心靶点的表达存在显著差异。通过计算 35 个核心靶点在 33 种癌症中的 log2(hazard ratio (95% CI)),并以 CDK4 和 CASP3 为例绘制森林图(图 8B、8C),结果显示 CDK4 与 LGG、LIHC 和 MESO 等癌症相关性较高,CASP3 与 SKCM、ACC 和 LGG 等癌症密切相关。这些结果揭示了核心靶点与多种癌症之间的关联程度,为后续研究特定癌症与核心靶点的关系提供了线索。
图 9 肾透明细胞癌(GSE53757)和脑低级别胶质瘤(GSE21354)中差异表达基因筛选、靶 - 通路图和 GSEA 通路富集分析结果
对 GSE53757(肾癌)和 GSE21354(低级别胶质瘤)数据集进行分析,使用 R 语言的 limma 包进行数据标准化和差异表达基因(DEGs)筛选。在肾癌数据集中,CCND1、MAPK1、MYC、CDKN1A 和 PDGFRB 基因显著上调,EGF 基因显著下调(图 9A);在低级别胶质瘤数据集中,RELA、BCL2L1、MYC、TP53、IGF1R、HIF1A、CCND1 和 CDK4 基因显著上调(图 9E)。同时构建了靶 - 通路图,展示了基因的表达变化情况(图 9B、9F)。GSEA 分析显示,肾癌中同种异体排斥、哮喘等通路显著上调,抗坏血酸和醛糖酸代谢等通路显著下调(图 9C、9D);低级别胶质瘤中抗叶酸耐药、抗原加工和呈递等通路显著上调,脂肪酸延长等通路显著下调(图 9G、9H)。这些结果有助于深入了解 AS - 癌症核心靶点在肾癌和低级别胶质瘤中的分子机制和相关通路变化。
图 10 肾癌预后靶点筛选及癌症风险预后模型构建结果
基于 TCGA - KIRC 的测序数据和总生存信息,对 35 个 AS - 癌症核心靶点基因进行单变量 Cox 回归分析,确定了 20 个与肾癌总生存显著相关的基因(图 10A)。为避免过拟合,进行 LASSO 回归分析,进一步筛选出 9 个基因,再通过多变量 Cox 回归分析确定 5 个基因(CDKN1A、ERBB2、CASP3、BCL2、TGFBR2)构建肾癌预后模型(图 10B - 10D)。根据模型计算风险评分(RS),将患者分为高、低风险组,生存分析表明低风险组患者的生存结局明显优于高风险组,该模型在 1、3、5 年的 AUC 分别为 0.695、0.681 和 0.697(图 10E、10F)。随着 RS 增加,患者生存时间缩短,死亡率增加,且相关基因表达水平发生变化(图 10G)。该图展示的结果为肾癌的预后评估提供了新的模型和依据。
图 11 脑低级别胶质瘤预后靶点筛选及胶质瘤癌症风险预后模型构建结果
利用 TCGA - LGG 的相关数据,对 35 个 AS - 癌症核心靶点基因进行单变量 Cox 回归分析,识别出 19 个与低级别胶质瘤总生存显著相关的基因(图 11A)。经过 LASSO 回归分析和多变量 Cox 回归分析,确定 8 个基因(EGFR、ERBB2、JUN、EGF、CDK4、BCL2L1、RAD51、TGFBR2)构建预后模型(图 11B - 11D)。计算风险评分(RS)并分组后,生存分析显示低风险组患者生存结局更好,模型在 1、3、5 年的 AUC 分别为 0.843、0.795 和 0.752(图 11E、11F)。随着 RS 增加,患者生存时间缩短,死亡率上升,且各基因表达水平升高(图 11G)。这些结果为低级别胶质瘤的预后评估提供了重要参考。
图 12 肾癌和低级别胶质瘤及其相应正常组织中核心靶蛋白表达的验证结果
从 HPA 数据库获取免疫组化结果,用针对 CDKN1A、ERBB2 和 BCL2 的抗体对正常肾脏组织和 KIRC 组织进行染色,结果显示与正常肾脏组织相比,KIRC 组织的免疫组化染色较浅,表明这三种蛋白在 KIRC 组织中显著低表达(图 12A - 12C)。用针对 CDK4、JUN 和 BCL2L1 的抗体对正常脑组织和 LGG 组织进行染色,结果显示 LGG 组织的免疫组化染色比正常组织深,表明这三种蛋白在 LGG 组织中显著高表达(图 12D - 12F)。该图验证了核心靶点蛋白在肿瘤组织和正常组织中的表达差异,为 AS 与这两种癌症的关联提供了组织水平的证据。
4. 研究总结
本研究综合运用数据挖掘、机器学习、网络毒理学、分子对接、分子动力学模拟和临床样本分析等多种方法,对人工甜味剂(AS)与癌症风险的关系进行了深入探究。研究人员确定了 7 种常用 AS 的相关靶点、AS - 癌症交集靶点、显著靶点和核心靶点,发现这些靶点参与多种生物学过程和癌症相关信号通路,且 AS 与核心靶点存在相互作用。通过泛癌分析和单变量 Cox 回归分析,揭示了核心靶点在不同癌症中的表达差异及与多种癌症的关联。对肾癌、低级别胶质瘤、乳腺癌和前列腺癌的研究确定了差异表达基因和相关通路变化,并构建了癌症风险预后模型。HPA 数据库验证了核心靶点蛋白在肿瘤组织和正常组织中的表达差异。综合表明,AS 可能通过多个靶点和信号通路增加肾癌、低级别胶质瘤、乳腺癌和前列腺癌的发病风险。本研究为食品添加剂的安全性评估和癌症风险评估提供了有价值的参考,同时建议加强食品安全监管,公众应减少食用含有 AS 和其他添加剂的食品和饮料。