
引言
液-液相分离(LLPS)火了十多年,从最初的“无膜细胞器怎么来的”,到如今渗透进转录调控、应激颗粒、神经退行性疾病、肿瘤等几乎所有热门方向 —— 可以说,它彻底颠覆了我们对细胞内空间组织的理解。
但伴随这股热潮,一个不容忽视的问题也浮出水面:大量研究把“蛋白聚集”等同于“相分离”,把显微镜下的一个荧光点直接当成结论。很多刚入场的研究者,其实并不是不想做严谨,而是根本不清楚:到底要拿出哪些证据,才能算真正证明了相分离?
为了解决大家的入门困惑,丸子决定用这个连载系列从最底层开始,一步步带大家搭建一套完整的相分离研究框架:理论基础→ 生信初筛 → 体外重构 → 细胞验证 → 功能闭环,希望能够给大家一点参考。作为开篇,我们先把两个最关键的问题讲透:
1)相分离到底在热力学上是什么意思?
2)在进实验室之前,如何用生物信息学提前判断你的蛋白有没有相分离的“潜质”?
01 为什么有的蛋白能发生相分离?
要完成相分离的精准判断,首先需理解其底层驱动机制。相分离的发生,核心依赖于生物大分子之间多价、弱、瞬时的分子间相互作用,这种相互作用使均一的大分子溶液自发分离为富集目标分子的致密液相与低浓度的稀疏液相,这一过程完全遵循热力学自由能最小化原则。
目前学界公认的“stickers-and-spacers(粘性点-间隔区)”模型,完美解释了蛋白相分离的序列基础:
▶ 粘性点(stickers):即驱动分子间相互作用的核心氨基酸残基,主要包括提供π-π相互作用、阳离子-π相互作用的芳香族残基,提供静电相互作用的带电残基,以及介导氢键形成的极性残基,是决定相分离发生与否的核心元件;
▶间隔区(spacers):即连接粘性点的柔性序列,多为固有无序区(intrinsically disordered regions, IDRs)或低复杂度结构域(low-complexity domains, LCDs),其柔性与长度直接调控分子间相互作用的强度与相分离的动态特性。
基于这一模型,相分离驱动蛋白的核心序列特征可归纳为两类:
① 富含IDRs/LCDs,尤其是类朊病毒结构域,这类序列在FUS、hnRNPA1、TDP-43等经典相分离蛋白中高度富集,为多价弱相互作用提供了核心骨架;
② 折叠结构域通过寡聚化形成多价支架,即使是无典型IDR的折叠蛋白,也可通过结构域的特异性结合形成多价互作网络,进而驱动相分离发生。
02 如何通过生信预测蛋白的相分离潜能?
通过生物信息学工具对目标蛋白序列进行相分离潜能初筛,是领域内公认的必要步骤。这一环节不仅能提前预判目标蛋白的相分离潜力,还能精准定位驱动相分离的核心序列区域,为后续的突变体构建、截短实验提供精准指导。
(一)预测工具的选择与组合策略
目前主流的相分离预测工具各有其适用场景与局限性,单一工具的预测结果易出现偏差,领域共识建议至少并行使用2-3种工具完成交叉验证。

(二)标准化预测操作步骤
基于领域内的通用规范与工具特性,为大家总结了一套可直接落地的三步预测流程:
1.第一步:IDR分布鉴定
▶ 先用IUPred或PONDR对目标蛋白全长序列进行分析,明确序列中IDR的位置、长度与占比,初步判断是否具备相分离的序列基础。
▶ 若蛋白全长无典型IDR,需进一步分析其是否存在可介导寡聚化的折叠结构域,评估多价互作的可能性。
2.第二步:相分离倾向综合评估
并行使用2-3种综合预测工具完成交叉验证:
▶ 常规蛋白优先选择catGRANULE+PScore的组合;
▶ 若目标为折叠蛋白,优先加入DeePhase/Molphase;
▶ 若为寄生虫、病原体相关蛋白,可补充FuzDrop完成分析。
重点关注工具输出的相分离评分与显著性,多工具均提示高相分离倾向的序列,具备更高的实验验证价值。
3.第三步:核心驱动元件精准定位
用PLAAC识别类朊病毒结构域,同时结合Phaseek定位序列中驱动相分离的关键粘性点残基,明确核心驱动区域。这一步的结果将直接指导后续实验中截短突变体、点突变体的构建,是功能验证实验的核心前提。
03 生信预测的核心避坑指南
1. 序列预测是必要不充分条件
高相分离评分仅代表蛋白具备发生相分离的序列潜力,绝不意味着其在生理条件下一定会发生相分离。
蛋白的表达水平、翻译后修饰、细胞内互作分子、微环境等因素,都会直接影响相分离的发生与否,最终的判定必须依赖实验验证。
2. 避免过度依赖单一工具的预测结果
不同工具的训练数据集与算法逻辑存在显著差异,单一工具的假阳性/假阴性风险较高。
例如,部分工具对富含正电荷残基的序列易出现过度预测,而对折叠结构域介导的相分离易出现漏判,必须通过多工具交叉验证降低偏差。
3. 不可忽略序列的进化保守性
若预测到的相分离核心驱动区域在物种间高度保守,提示该区域的相分离特性可能具备重要的生物学功能,可大幅提升后续研究的价值;
若仅在单一物种中出现,需警惕非特异性互作导致的假阳性预测。
小结
今天我们厘清了相分离的核心分子基础,构建了一套标准化的序列水平相分离潜能预测流程,是踏入相分离研究领域的第一步。通过生信初筛,我们可以快速锁定具备相分离潜力的目标蛋白与核心序列区域,为后续实验奠定基础。
在下一篇连载中,我们将进入相分离研究的核心硬证据环节:体外重构实验的全流程操作,详细讲解从蛋白纯化、相分离诱导,到液滴特性多维表征的每一个关键步骤,教你如何在试管中“实打实”看到并验证相分离的发生。
参考资料
1. Gilroy KE, Barr JN. A systematic evaluation of protein phase separation predictors across diverse protein landscapes. Preprint. Posted online January 22, 2026. bioRxiv. doi:10.64898/2026.01.20.700394
2. Mohammad Hosseini AM, Teimouri H, et al. Generalizable prediction of liquid-liquid phase separation from protein sequence. Preprint. Posted online January 27, 2025. bioRxiv. doi:10.1101/2025.01.27.635039
3. Iglesias V, Avalos-Padilla Y, Bárcenas O, et al. Liquid-liquid phase separation (LLPS) as a sensing and adaptation mechanism: an evidence-based hypothesis on AP2 transcription factors in the malaria parasite. Preprint. Posted online December 12, 2025. bioRxiv. doi:10.64898/2025.12.10.693351