昨天用vina进行了一下小规模的虚拟筛选,但是按照1个1分钟,一次性并行80个,一天也只能算10w个左右的分子,所以有没有更高通量的筛选方式呢?
查了一下,目前起码有两种以上的方法可以进行超大规模的虚拟筛选
qvina
据说比autodock vina快一点,但是这是四五年前的宣称了,autodock vina也更新了一点版本,而qvina没有改进,不知道现在怎么样,应该是百万级别?
autogrow/Docking/Docking_Executables/QVina02 · adfee9d6e656da9127c99410e61134df13711a85 · jdurrant / autogrow3 · GitLab (pitt.edu)
Autodock 分子对接 [2] - 用Autodock Vina / QuickVina2 / QuickVina-W做对接_哔哩哔哩_bilibili
virtulalFlow
十亿级别的
An open-source drug discovery platform enables ultra-large virtual screens | Nature
平均而言,一种获得批准的药物目前的成本为20-30亿美元,开发时间超过10年。在某种程度上,这是由于昂贵和耗时的湿实验室实验,贫穷的初始命中化合物和高磨损率在(前)临床阶段。基于结构的虚拟筛选有可能缓解这些问题。使用基于结构的虚拟筛选,随着屏幕上化合物的数量的增加,点击的质量也会提高。然而,尽管存在着大型的化合物数据库,但是要在计算机集群上以可访问、高效和灵活的方式实现大规模基于结构的虚拟筛选还是很困难的。在这里,我们描述 VirtualFlow,一个高度自动化和多功能的开源平台,具有完美的缩放行为,能够准备和有效地筛选超大型化合物库。VirtualFlow 能够使用各种最强大的对接程序。使用 VirtualFlow,我们准备了一个最大的,免费提供的准备停靠配体库,有超过14亿个商业上可用的分子。为了证明 VirtualFlow 的威力,我们筛选了超过10亿种化合物,并鉴定了一组结构不同的分子,它们与 keap1结合,并具有亚微摩尔亲和力。其中一种铅抑制剂(iKeap1)与 keap1具有纳摩尔亲和力(Kd) = 114nm) ,破坏了 keap1与转录因子 nrf2之间的相互作用。这说明了 VirtualFlow 的潜力,它可以访问化学空间的大量区域,并识别与目标蛋白质结合的高亲和力分子。
Introduction | VirtualFlow (virtual-flow.org)
VirtualFlow is mainly written in Bash (a Turing complete command language), which not only makes it simple for anyone to modify and extend the code, but also has essentially no computational overhead and is readily available in any major Linux distribution. The code for VirtualFlow is freely available on https://github.com/VirtualFlow, distributed under the GNU GPL open-source licence. The primary homepage for end users, which includes additional resources such as documentation, ligand libraries, tutorials and video demonstrations, is available at https://www.virtual-flow.org. The external docking programs discussed here are available as follows: AutoDock Vina is available at http://vina.scripps.edu, QuickVina 2 and QuickVina-W at https://qvina.github.io, Vina-Carb at http://glycam.org/docs/othertoolsservice/download-docs/publication-materials/vina-carb, Smina at https://sourceforge.net/projects/smina, AutoDockFR at http://adfr.scripps.edu and VinaXB at https://github.com/ssirimulla/vinaXB.
v-synthes
百亿级别
Synthon-based ligand discovery in virtual libraries of over 11 billion compounds | Nature
基于结构的虚拟配体筛选由于具有高分辨率的靶结构和超大的虚拟配体库正成为早期药物发现的一个重要范例。然而,为了跟上虚拟库的迅速发展,如现成的(REAL)组合库,需要新的方法来进行化合物筛选。本文介绍了一种基于模块合成子的方法—— v-synthes ——对超过110亿个化合物进行基于层次结构的 REAL 空间库筛选。V-SYNTHES 首先确定适合进一步生长的最佳支架合成子组合,然后对这些种子进行迭代阐述,以选择具有最佳对接得分的完整分子。这种分级组合方法能够快速检测出巨藻化学空间中得分最高的化合物,同时只对库化合物的一小部分(< 0.1%)进行对接。化学合成和 v-syntheses 预测的新型大麻素拮抗剂的实验测试显示了33% 的命中率,包括14个亚微摩尔配体,大大提高了 Enamine REAL 多样性子集的标准虚拟筛选,这需要大约100倍的计算资源。最佳效应类似物的合成进一步提高了效价和亲和力(最佳抑制常数(Ki) = 0.9 nM)和 CB2/cb1选择性(50-200倍)。V-SYNTHES 还在一个激酶靶标 rock1上进行了测试,进一步支持其用于铅发现。该方法易于扩展,适用于组合库的快速增长,并可适用于任何一种对接算法。
katritchlab/V-SYNTHES (github.com)