生物体内的大多数反应都需要酶的参与,酶在生命活动中发挥了重要作用。IUBMB/UPAC 国际标准化命名委员会对已经发现的酶都提供了标准化的的命名方式,叫做EC number。
KEGG ENZYME 整合了ExplorEnz 数据库中酶的信息,处理基本的Ec number 和name 等属性外,还提供了对应的序列信息。
来看下每条记录的信息
Entry | 酶编号,EC number |
---|---|
Name | 酶的名称 |
Class | 所属的分类 |
Sysname | 其他名称 |
Reaction | 酶催化的反应 |
Substrate | 底物 |
Product | 产物 |
Comment | 注释 |
History | 修订记录 |
Pathway | 参与的通路 |
Orthology | 对应的KO 信息 |
Genes | 在各种物种中对应的基因 |
Reference | 参考文献 |
Other DBs | 其他数据库的链接 |
酶催化生物反应的进行,所以会与 pathway, raction,compound 数据库产生联系。在Enzyme 与其他数据库的联系中,我们需要重点理解与KO的对应关系。
在1995 年,KEGG 数据库刚开始创建的时候,EC number 主要用来绘制代谢通路图;直到1999 年,提出了Orthology ID的概念,用来取代EC number, 绘制通路图;到2002年,Orthology ID 变成了KO, EC number 就作为KO的属性出现了。那么EC number和 KO之间存在怎样的对应关系呢?
酶是基因的产物,而基因有对应的KO注释。通过基因,以基因为桥梁,可以更好的理解酶和KO之间的对应关系。
虽然有实验证据表明这种酶的存在,但是缺乏对应的基因信息,也就没有对应的KO 注释, 比如
1.1.1.46
, 就没有对应的KO信息;-
这种酶在多个物种中都存在,也就有对应的多个基因,这些基因分属不同的KO(当然这些KO的功能描述还是很接近的), 此时会出现1个EC Number 对应多个KO的情况, 比如
1.1.1.376
-
这种酶对应的多个基因属于同一个KO, 比如
1.1.1.388
-
多个酶对应同一个KO, 多个酶对应的基因被归类到了同一个KO下,比如
1.1.1.49
和1.1.1.363
。
总结
Enzyme 数据库存储了酶的相关信息,每种酶用EC number 唯一标识;
Ec number 与KO的对应关系比较复杂,可以通过基因来理解它们之间的对应关系;