8 注释数据库KEGG和GO

注释数据库KEGG和GO

KEGG

构成

  • KEGG是一个综合数据库,里面包含了很多种类的信息。KEGG数据库包括PATHWAY、KO等多个子库。

PATHWAY

  • KEGG pathway的检索结果是一张描述不同基因在某一过程中相互作用的图
  • 每个KEGG pathway都有一个标识符,这个标识符由一个字母前缀和一个五位的数字组成
KEGG PATHWAY

PATHWAY前缀

对于KEGG pathway来说,前缀可以有以下五种
* map:基因互作的通路图
* ko:在map的基础上高亮显示基因(点击可以展示具体信息)
* ec:在map的基础上高亮显示参与反应的酶(点击可以展示具体信息)
* rn:在map的基础上高亮显示发生的生化反应(点击可以展示具体信息)
* <org>:查找特定物种的通路图(每个物种有一个专用的编号,比如人是hsa,如果不知道号码是什么,可以点击Organism按钮,输入拉丁名就可以显示编号,并将其加入搜索框)

PATHWAY数据库使用ko前缀检索

KO

  • KO数据库是用来搜索基因的。同样,每个基因也有一个标识符。在KO数据库中,这个标识符以K开头,后加一个五位数字。
  • KO的搜索结果包含与基因有关的一系列信息,包括名称、参与的通路、相关的疾病等
  • 注意KO数据库里搜出来的是基因,PATHWAY的ko前缀里面找出来的是通路,但KO数据库里找出来的基因的信息里展示了对应的ko通路
KO数据库检索结果

GO

GO数据库

GO term

  • GO数据库从三个不同的角度对同一基因进行描述。这些描述词汇称作GO term
    • 细胞学组分(cellular components,CC)
    • 分子功能(molecular functions,MF)
    • 生物学过程(biological process,BP)

细胞组分

  • 细胞中的位置
  • 指基因产物位于何种细胞器或基因产物组中

分子功能

  • 描述在分子生物学上的活性,如催化活性或结合活性
  • 只定义功能,也不指出这些功能具体的时空信息

生物学过程

  • 由分子功能有序地组成的,具有多个步骤的一个过程
  • 与一个生物学通路不完全相等

GO注释

  • 用一系列GO term对某一基因进行描述
  • 一个基因可能不止一个GO term

GO检索

  • 在GO中进行检索,可以得到三种结果
    • Ontology:这里显示了与检索词匹配的GO term
    • Genes and gene products:这里显示了与检索词匹配的基因及产物
      • 点击基因名可以查看描述这个基因的GO term
    • Annotations:这里显示的是GO term与基因及产物之间的对应关系
      • 因为一个GO term可对应多个基因,一个基因也可对应多个GO term,因此这里的条目非常多
GO检索结果

GO富集

  • GO数据库首页提供了在线进行富集分析的功能
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容