KEGG API 用法详解上篇

对于大多数的数据库而言,API接口可以方便的从数据库中检索数据。kegg 数据库的API 链接如下:

http://www.kegg.jp/kegg/rest/keggapi.html

API 其实就是一种约定号的URL 规则,通过特定的URL 返回不同的数据。kegg 的 API 的URL 构成如下:

http://rest.kegg.jp/operation/argument[/argument2[/argument3 …]]

前缀都是 http://rest.kegg.jp, 接下来就是对应的操作,kegg 一共提供了以下7种操作:

  1. info

  2. list

  3. find

  4. get

  5. conv

  6. link

  7. ddi

接下来详细看下每种操作的用法

info

主要用于展示每个数据库共有多少条记录的统计信息和于该数据相关的其他数据库,url 格式如下:

http://rest.kegg.jp/info/database
database = kegg | pathway | brite | module | ko | genome | genes | org | vg | ag | ligand | compound | glycan | reaction | rclass | enzyme | network |
variant | disease | drug | dgroup | environ

示例 : 查看pathway 数据库的基本信息

http://rest.kegg.jp/info/pathway

pathway KEGG Pathway Database
path Release 85.0+/03-11, Mar 18
Kanehisa Laboratories
570,005 entries
linked db module
ko
genome
<org>
compound
glycan
reaction
rclass
enzyme
network
disease
drug
pubmed

list

列出数据库中所有的记录,或者列出指定条目的记录
对于list 操作,共有3种不同的URL 格式

第一种,查看数据库中所有的记录

http://rest.kegg.jp/list/database
database = pathway | brite | module | ko | genome | org | vg | ag | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | organism | medicus

示例:查看所有ko的信息

http://rest.kegg.jp/list/ko

ko:K00001    E1.1.1.1, adh; alcohol dehydrogenase [EC:1.1.1.1]
ko:K00002    AKR1A1, adh; alcohol dehydrogenase (NADP+) [EC:1.1.1.2]
ko:K00003    E1.1.1.3; homoserine dehydrogenase [EC:1.1.1.3]

第二种,只针对pathway和 module 数据库 ,查看特定物种的信息,格式如下

http://rest.kegg.jp/list/database/org
database = pathway | module

示例:查看human对应的所有pathway 信息

http://rest.kegg.jp/list/pathway/hsa

path:hsa00010    Glycolysis / Gluconeogenesis - Homo sapiens (human)
path:hsa00020    Citrate cycle (TCA cycle) - Homo sapiens (human)
path:hsa00030    Pentose phosphate pathway - Homo sapiens (human)

第三种,查看数据库中的某几条记录,使用数据库中的标识符进行查找,多个标识符用+ 链接,最多1个URL 中允许查找10个

http://rest.kegg.jp/list/dbentries
dbentries = Entries of the following database
database = pathway | brite | module | ko | genome | org | vg | ag | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | medicus

示例:查看pathway 中 map00010 和 map00040 的信息

http://rest.kegg.jp/list/map00010+map00040

path:map00010 Glycolysis / Gluconeogenesis
path:map00040 Pentose and glucuronate interconversions

find

find 用于在数据库中根据关键词进行查找, 格式如下

http://rest.kegg.jp/find/database/query
database = pathway | brite | module | ko | genome | genes | org | vg | ag |
ligand | compound | glycan | reaction | rclass | enzyme | network | variant | disease | drug | dgroup | environ | medicus

示例:根据关键词 shiga和toxin 查找相关的基因

http://rest.kegg.jp/find/genes/shiga+toxin

ece:Z1464    stx2A; shiga-like toxin II A subunit encoded by bacteriophage BP-933W
ece:Z1465    stx2B; shiga-like toxin II B subunit encoded by bacteriophage BP-933W
ece:Z3343    stx1B; shiga-like toxin 1 subunit B encoded within prophage CP-933V

关于后面4种操作的用法,我们下一篇进行介绍,今天就到此为止。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容