
引言
在新药研发中,找到活性化合物只是第一步,明确其在生物体内的核心作用靶标,才是破解作用机制、降低脱靶毒性、推进研发的关键。这一从药物化学结构逆向锁定靶标的过程,是表型药物发现、老药新用等领域的核心难题,也直接决定着新药项目的成败。
如今,随着计算科学、人工智能和高分辨生物分析技术的发展,靶标发现已形成“计算预测缩范围,实验验证定靶标”的黄金法则,通过结构相似性匹配、反向虚拟筛选、化学基因组/AI建模、实验验证四步联用,先从数万种蛋白中快速锁定候选靶标,再经精准实验确证,让原本“大海捞针”的工作,变成了有章可循的系统化研究。
一、结构相似性匹配:经典初筛,快速锁定已知靶标线索
这是最直观、成本最低的初始筛选方法,核心基于“相似分子作用于相似靶标”的朴素原理,如同“长得像的钥匙,大概率开同一把锁”,是靶标发现的“敲门砖”。
① 核心流程:先将药物的二维/三维结构转化为计算机可识别的分子指纹或SMILES字符串,再在ChEMBL、PubChem、DrugBank等权威数据库中,通过Tanimoto系数计算待测分子与已知活性分子的相似度,排序后提取相似分子的已知靶标,作为候选靶标列表。
② 常用工具:Swiss Target Prediction(融合2D/3D相似性评估,输出靶标概率排名,适配人、小鼠等多个物种)。
③ 优劣势:优势是速度快、操作简单、计算资源消耗低;局限性在于无法解决“活性悬崖”问题(分子微小结构改变导致活性/靶标剧变),且只能在已知知识范围内推断,无法发现全新靶标。
二、反向虚拟筛选:三维匹配,探索新颖靶标与脱靶效应
若说结构相似性匹配是“找相似钥匙”,反向虚拟筛选则是“拿特定钥匙试千万把锁”,打破传统“一个靶标找多个配体”的模式,转为“一个配体筛查数百个靶标”,基于分子与蛋白的空间互补、静电作用等物理化学原理实现匹配。
① 核心流程:先对药物小分子进行3D构象生成和能量最小化,再将其与PDB、scPDB等数据库中具有可成药性结合口袋的蛋白三维结构逐一进行分子对接,通过Auto Dock Vina、Glide等工具计算结合自由能,按打分高低排序获得候选靶标。
② 主流方法与工具:反向药效团匹配是核心方法,PharmMapper为标志性工具,可提取药物低能构象的药效团特征,与超23000个蛋白的成药性药效团模型比对,快速输出高置信度候选。
③ 优劣势:优势是能突破结构相似性限制,发现新颖靶标和药物脱靶效应,为老药新用提供线索;局限性在于计算量巨大、打分函数预测结合能精度有限,且未考虑蛋白质“诱导契合”的构象柔性,存在一定假阳性。
三、化学基因组学与AI建模:数据驱动,提升预测精度与效率
人工智能的崛起颠覆了传统靶标预测模式,通过整合化学空间、基因组空间的海量数据,学习药物-靶标相互作用的非线性规律,实现更精准、更高效的预测,尤其适合新颖骨架药物的靶标挖掘。
① 核心类型
▶ 化学基因组学:融合药物结构、蛋白序列/结构、基因表达、高通量筛选等多维度数据,构建综合预测模型,打破单一数据的局限性。
▶ 深度学习模型:无需人工设计特征,可自动从原始数据提取高维信息,主流模型包括DeepDTA(基于SMILES和蛋白序列的1D-CNN)、GraphDTA(以分子图为基础的GNN模型,精准捕捉分子三维拓扑特征),还有前沿的DrugHash将靶标预测转为哈希检索,实现32倍内存节省和3.5倍速度提升。
② 工业级平台
PandaOmics是典型代表,整合多组学数据和自然语言处理技术,从疾病信号通路网络视角挖掘靶标,还可与分子生成平台联动,实现“靶标发现-先导化合物设计”的闭环。
③ 优劣势
优势是泛化能力强、可处理超大规模数据,能整合多维度信息提升预测精度;局限性在于“数据饥渴”,对训练数据匮乏的“不可成药”靶标易产生假阳性,且模型可解释性较弱。
四、实验验证:金标准环节,从候选靶标中锁定真实靶标
计算预测仅提供“嫌疑人名单”,实验验证是确认药物与靶标真实结合的核心环节,需根据药物能否化学修饰、研究靶标类型(如激酶)选择适配技术,核心分为无标记验证、直接亲和捕获、功能验证三类,各有适用场景,可互补使用。
▶ TPP(CETSA-MS,细胞热位移分析-质谱),无修饰原位验证
这是当前生理相关性最强的无标记验证技术,无需修饰药物,可在活细胞/组织中直接验证药物与靶标的结合,是实验验证的首选。
① 核心原理:药物与靶标结合后,会稳定蛋白构象,提升其热稳定性,使蛋白熔解温度(Tm)升高;通过温度梯度加热或等温药物浓度梯度处理,结合质谱定量分析药物处理组与对照组的蛋白可溶性差异,若靶标蛋白Tm显著偏移(ΔTm)或呈现剂量依赖性的稳定性提升,即为结合证据。
② 优劣势:优势是生理相关性强、无需药物修饰、可全蛋白质组高通量筛选;局限性在于对操作精度要求高,对热稳定性极髙/极低的蛋白或膜蛋白检测难度大。
▶ LiP-MS(DARTS-MS,药物亲和力响应靶标稳定性分析-质谱),简单经济的无标记补充
与TPP原理异曲同工,以“酶切应激”替代“热应激”,同样无需修饰药物,操作更简单、成本更低,适合作为实验条件受限的初步筛选。
① 核心原理:药物与靶标结合后会改变蛋白构象,隐藏蛋白酶切位点,使靶标蛋白对非特异性蛋白酶的降解产生抗性;在细胞裂解液中对比药物处理组与对照组的蛋白酶解后丰度,丰度显著更高的蛋白即为候选靶标。
② 优劣势:优势是操作简便、成本低、适用范围广;局限性在于蛋白酶切条件优化难度大,易出现假阳性/假阴性。
▶ Drug Pull down-MS(药物亲和沉淀-质谱),直接捕获的硬证据
若药物可进行化学修饰,该技术是提供直接物理结合证据的金标准,直接将与药物结合的蛋白“钓”出鉴定。
① 核心流程:在不破坏药物活性的位点引入连接臂和亲和标签(如生物素),构建药物探针;将探针与细胞裂解液孵育后,用链霉亲和素磁珠捕获“探针-靶标蛋白”复合物,经洗涤、洗脱后通过质谱鉴定。
② 前沿优化:引入光亲和标记(PAL)和点击化学,提升捕获效率,减少空间位阻对结合的干扰。
③ 优劣势:优势是证据直接、信噪比高,还可鉴定靶标相关蛋白复合物;局限性在于依赖药物化学修饰,修饰位点选择不当可能破坏药物活性。
▶ 特定场景:磷酸化蛋白质组学,激酶/信号通路靶标的功能验证
若预测靶标为激酶或药物作用于信号通路,仅验证“物理结合”不足以阐明机制,需通过磷酸化蛋白质组学进行功能层面的验证,从磷酸化水平变化反推激酶活性改变。
① 核心原理:激酶抑制剂会导致其直接底物及下游分子的磷酸化水平显著变化;通过TiO2微球、IMAC等技术富集磷酸化肽段,结合质谱在全蛋白质组范围内定量检测磷酸化位点变化,再通过KSEA(激酶-底物富集分析)锁定受抑制的核心激酶。
② 优劣势:优势是提供“结合+功能”的双重证据,可描绘药物对信号通路的整体影响;局限性在于实验操作复杂、成本高,磷酸化修饰动态性强,对样品处理要求严苛。
五、整合工作流:从预测到验证的系统化路径
① 广泛候选生成:并行使用结构相似性匹配、反向虚拟筛选、AI建模,取结果交集/并集并按置信度排序,形成数百个候选的初步列表;
② 初步实验筛选:用TPP或LiP-MS进行无标记验证,将候选列表缩小至十几个核心靶标;
③ 精确靶标确认:若药物可修饰,通过Drug Pull down+MS进行正交验证,两种不同原理技术均鉴定到的蛋白,为高置信度靶标;
④ 功能机制确证:激酶靶标用磷酸化蛋白质组学验证通路变化,其他靶标通过CRISPR/Cas9敲除、体外生化实验等,证明药物通过该靶标产生生物学表型。
总结
从药物结构到作用靶标的发现,是融合计算化学、化学生物学、质谱技术、人工智能的系统工程,并非单一技术可完成。计算预测的价值在于“高效缩范围”,通过结构相似性、反向虚拟筛选、AI建模将候选靶标从“大海”缩至“池塘”;实验验证的核心是“精准定靶标”,根据药物特性选择蛋白质组学质谱技术,构建相互印证的证据链。
未来,随着AI与多组学的深度融合、新型实验技术的涌现,靶标发现将朝着更智能、更整合、更高效的方向发展,但始终离不开“计算预测为假设,实验验证为根本”的核心逻辑。唯有灵活组合各类技术,交叉验证结果,才能在复杂的生物体系中,精准锁定决定药物命运的核心作用靶标,加速创新药物的研发进程。
⬇️⬇️⬇️
LiP - MS科研buff 加持!药物靶点研究3大场景轻松破局
▶ 药物靶点筛选:在体外生理条件下,寻找小分子药物可能的作用靶点。
▶ 药物 - 蛋白结合域分析:于体外生理条件中,探究纯化重组蛋白和目标药物的作用区域以及结合位点。
▶ 药物机制研究:在体内给药的条件下,钻研小分子药物潜在的作用靶点及其发挥作用的机制。
参考资料
1. Daina A, Michielin O, Zoete V. SwissTargetPrediction: updated data and new features for efficient prediction of protein targets of small molecules. Nucleic Acids Research. 2019;47(W1):W357‑W364.
2. Wang X, Pan C, Sun H, et al. PharmMapper server: a web server for potential drug target identification using pharmacophore mapping approach. Nucleic Acids Research. 2010;38(suppl_2):W609‑W614.
3. Nguyen T, Le H, Quinn TP, et al. GraphDTA: predicting drug–target binding affinity with graph neural networks. Bioinformatics. 2021;37(8):1140‑1147.
4. Mateus A, Savitski MM. Thermal proteome profiling for drug target identification and probing of protein states. Methods in Molecular Biology. 2023;2554:201‑215.
5. Siaweski G, Schopper S, Picotti P. Target deconvolution by limited proteolysis coupled to mass spectrometry (LiP‑MS). Methods in Molecular Biology. 2023;2554:181‑199.
6. Wiredja DD, Koyutürk M, Schlatzler D, et al. Kinetic substrate‑enrichment analysis (KSEA) for kinase activity profiling. Proteomics. 2017;17(17‑18).