【数据库】RetroRules

RetroRules是一个代谢途径发现和代谢工程的反应规则数据库。反应规则是对反合成工作流程中所使用的反应的一般描述,以便枚举连接目标分子与前体的可能生物合成路线。在合成生物学应用于新途径发现的背景下,以及在系统生物学中发现由于酶乱交而引起的地下代谢的背景下,这些规则的使用变得越来越重要。

RetroRules提供了一组完整的反应规则,这些规则是从公共数据库中提取出来的,以社区标准的SMARTS格式表示,并由具有不同特异性级别(反应中心周围的原子环境)的规则表示加以增强。这种反应的多重表征通过预测混杂酶的从头反应扩展了自然化学多样性。我们的规则很容易被开源的化学信息工具(如RDKit)以及更复杂的逆转录代码(如RetroPath2.0)所使用。

RetroRules通过搜索不同的可能查询,如EC号、反应ID、底物结构查询等,将反应规则返回给用户。请注意,当查询反转规则时,不太具体的反应规则会根据最小直径阈值被过滤掉。直径是包含反应中心周围原子的球体。直径越大,规则就越具体。

RetroRules是代谢工程反应规则的数据库(https://retrorules.org)。反应规则是化学反应的一般描述,可用于逆向合成工作流程,以列举将目标分子与其前体相连的所有可能的生物合成途径。在应用于新路径发现的合成生物学背景下,以及在系统生物学中,由于酶的混杂性,这些规则的使用变得越来越重要。在这里,我们首次提供了一个完整的集合,包含从公共数据库中提取的> 400,00 0个立体化学感知的反应规则,并以社区标准的SMARTS(SMICKS)格式表示,通过在不同特异性水平(反应中心周围的原子环境)的规则表示进行了扩充。如此众多的反应表征通过预测混杂酶的从头反应扩展了天然化学多样性。

RetroRules免费下载是一个SQLite数据库,其中包含15表和大约600万条目相互关连的反应,规则,代谢物,序列,和一个规则得分基于生化多样性(图1)。中心的模式规则表,其中包含的信息来唯一地描述反应规则从mono-component反应。

image.png

2020-12-08:从上面的表设计架构可以看出,这个反应规则数据库很复杂。我们在设计负责的数据库时候也要利用流程图,完成对数据存储的规划和设计。

从给定直径的给定反应中,一个规则与给定的底物唯一地联系在一起,为了确定一个给定规则是否表示反应的立体化学,布尔型柱是等立体的。因为反应规则可以有多个产品,rule_products表包括所有规则的惟一标识符(即reaction_id、substrate_id、直径和isSetereo)结合列product_id和化学计量规则描述一种化学产品,该产品出现的次数的规则,分别。因此,rule_products表与规则表之间包含一对多关系。由于给定的SMARTS或SMILES反应规则描述可以应用于多种反应、底物和直径,两者都可以在SMARTS和SMILES表格中分别找到。其余的表包含从源数据库提取的元信息。所有的蛋白质序列、化学结构和父反应数据都可以在它们各自的公共数据库中找到。

RetroRules通过搜索不同的可能查询,如EC号、反应ID、底物结构查询等,将反应规则返回给用户。请注意,当查询反转规则时,不太具体的反应规则会根据最小直径阈值被过滤掉。直径是包含反应中心周围原子的球体。直径越大,规则就越具体。

参考资料:

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 写在前面 声明:本文大部分是基于ArangoDB的论文的翻译,在翻译过程中加入了自己的一些理解和说明。 无论是为一...
    吕信阅读 9,822评论 0 13
  • 前言 我们是接着上一篇写的Android数据库,第二篇。(主要就是研究Sqlite数据库) 继续开车:: 12)....
    yzzCool阅读 5,182评论 0 1
  • 生物数据库 基本序列格式 1.FASTA格式:首行为描述行,以>为起始,其后为描述信息;第二行即为原始序列。2.F...
    Andy宇阅读 14,038评论 1 40
  • 一、MongoDB简介 概述MongoDB是一个基于分布式文件存储的数据库,由C++语言编写。旨在为WEB应用提供...
    未央_m阅读 3,968评论 0 1
  • 转载 :https://www.plob.org/article/3856.html 生物信息数据库与查询 近年来...
    oddxix阅读 13,838评论 0 37