AlphaFold3(AF3)既可以通过在线平台使用,也可在本地部署运行。在线平台开箱即用,每个账号每天最多提交20个预测任务。AF3 最大的亮点在于它可以预测由蛋白质、核酸、小分子、离子以及修饰残基等多种分子组成的复合物结构。
一、准备工作
1. 在线平台
AlphaFold3 的官方网站为:https://alphafoldserver.com/welcome
目前支持两种输入方式:
① 手动填写每个任务的参数;
② 上传 .json 格式的批量任务配置,更适合批量预测。
2. 登录
使用 Google 账号登录,点击左上角的 Server 进入任务页面。
二、示例演示:RNA-蛋白-离子复合物预测
我们将以一个带有离子的蛋白质-结合RNA复合物为例,检验 AlphaFold3 的预测准确性。
我们从冷冻电镜(Cryo-EM)结构数据库中选取一个已解析的复合物:Trypanosoma brucei ADAT2/3 脱氨酶与 tRNA 的复合物结构。
可以从 RCSB PDB(https://www.rcsb.org)下载该复合物的 FASTA 文件,作为测试数据使用。
当然,也可以使用自己的数据。
1. 数据准备
下载目标复合物的 FASTA 文件;
将文件保存备用。
三、任务配置与提交
1. 添加分子组分
在任务配置界面中,逐一添加 RNA、蛋白质、离子等组分。每添加一个分子,填写对应的序列或结构信息。
2. 启动预测
填写完毕后,点击 启动结构预测任务。
四、查看预测结果
1. 可视化图像
预测完成后,系统会提供结构可视化图像。结构中不同区域的颜色代表预测置信度:
颜色越蓝:表示预测置信度越高;
颜色越橙:表示预测置信度越低。
2. 置信度指标解释
AlphaFold3 提供多个衡量结构预测准确性的指标,主要包括:
① pLDDT(per-residue Local Distance Difference Test)
是每个原子的置信度评分,范围 0–100,数值越高表示置信度越高。
pLDDT 是基于修改后的 LDDT 评分,仅考虑原子与聚合物之间的距离。
对于蛋白质,相当于原子级别的 lDDT-Cα,但具有更高分辨率;
对于小分子配体,仅计算配体原子与聚合物之间的误差;
对于 DNA/RNA,修改后的 LDDT 采用 30 Å 的参考半径(AlphaFold2 为 15 Å)。
② pLDDT 的可视化采用与 AlphaFold Protein Structure Database (AFDB) 相同的配色方案。
PAE(Predicted Aligned Error)
估计结构中两个“标记”(token)之间相对位置和朝向的预测误差。
分数越高,表示误差越大、置信度越低。
对蛋白质和核酸,误差是相对于主链框架计算;
对小分子和翻译后修饰,则为每个原子根据其在参考构象中的最近邻原子构建局部框架。
③ pTM 与 ipTM 分数
均基于模板建模得分(TM-score),用于衡量整体结构与真实结构的接近程度。
pTM(predicted TM-score):衡量复合物整体的构象准确性;
大于 0.5 表示整体结构可能接近真实结构;
少于 20 个标记(token)时,pTM 评分会小于 0.05;
ipTM(interface predicted TM-score):衡量复合物中不同亚基之间相对排布的准确性;
大于 0.8:高可信度;
小于 0.6:预测可能失败;
介于 0.6–0.8:预测准确性不确定。
注意:在结构较小或链较短的情况下,pTM 分数较严格,此时更推荐参考 PAE 或 pLDDT 指标。
五、结果下载与可视化
预测完成后,可下载 .cif 格式的结构文件;
使用 PyMOL、ChimeraX 等结构可视化软件打开,进行后续分析与展示。
生物信息学领域非常广泛,难以一次说尽。我们下次继续更新,一起深入学习生物信息学的内容!
喜欢的宝子们点个赞吧~码字不易,且行且珍惜~