【陪你学·生信】四、蛋白质相关的数据库

一、简单说蛋白质合成

对蛋白质提取和测序比DNA的操作贵,一般大家先分析核苷酸序列,推测ORFs,机器翻译出蛋白质的氨基酸序列。但是研究蛋白质的科学家觉得这个方法并不可靠。

因为一个成熟蛋白质的aa链需要经过很多修饰(切割、水解、甲基化等化学修饰、添加脂质分子、添加糖苷分子等),仅通过预测ORF→翻译蛋白也会把成熟蛋白质最基本的理化性质搞错,比如大小,分子质量,等电点。

前面的文章中介绍的数据库也有ORFs和机器翻译的aa信息。与之前简单的机器预测结果相比,蛋白质数据库的主要作用是展示蛋白质的一系列修饰信息,定位和结构域的信息等。而且Swiss-Prot是人工审核校对,注释的,其结果多为有实验证据支持的,而非全部都是计算机分析的结果。

二、Swiss-Prot数据库

尽管前面说了很多成熟蛋白质的诞生是多么不容易,但其实,就其长度短,起始终止区域明确,单链等特点,还是比较简单的分析对象。

其结果页面的条目也是很清晰的,包括基础信息、参考文献、功能信息、特征表和序列部分。以人类 epidermal growth factor receptor (EGFR,表皮生长因子受体)为例,Accession Number P00533,看看Swiss-Prot中的结果。

数据库主页

https://www.uniprot.org/

左侧display栏中将结果分为四部分,内容真的很多,点进去都会有详细的解释:

还有一些交叉数据库的链接, 比如EMBL,PDB等。

三、分析蛋白质的更多信息——其他数据库

Swiss-Prot结果页已经对感兴趣蛋白质的综合信息展示地很全面了,而且也有该蛋白质在一些其他数据库的信息的超链接,但是还是额外介绍一下其他的分析蛋白质特定信息的网站吧。

1. 形成成熟蛋白质过程中对氨基酸的修饰

RESID(https://proteininformationresource.org/resid/resid.shtml)中检索关键词比如肉豆蔻酰化修饰(myristoylation),可以获得其化学式等详细信息。也可以在Swiss-Prot获得你想搜索的蛋白质ID,再去RESID中查找其修饰过程,不过有的没有被收录。

2. 包含更多生化信息的网站

(1)Glycan 数据库

收录了糖类物质的结构信息,并给出了糖类参数的各种代谢通路等。

http://www.glycanstructure.org/

(2)Lipid Bank 脂质信息数据库

http://lipidbank.jp/

(3) ChemIDplus 化合物化学结构

https://chem.nlm.nih.gov/chemidplus/

3. 蛋白质参与的生化途径

(1)Kyoto Encyclopedia of Genes and Genomes(KEGG)数据库

https://www.genome.jp/kegg/kegg2.html

(2)brenda数据库——生物合成催化酶数据库(设计实验必不可少的工具)

https://www.brenda-enzymes.org/

(3)大肠杆菌K-12 MG1655的数据库,包含基因组、转录调控、转运蛋白和代谢途径等信息。

https://ecocyc.org/

4. 蛋白质结构

对蛋白质的氨基酸序列进行分析之后,我们可能还想知道这几个氨基酸残基的位置,它们是否在蛋白质表面?与另一个残基是近还是远?回答这些问题需要先了解该蛋白质的结构信息。推荐以下数据库:

(1)PDB——最常用

https://www.rcsb.org/

(2) NCBI-Structure

https://www.ncbi.nlm.nih.gov/Structure/MMDB/mmdb.shtml

(3)SCOP

http://scop.mrc-lmb.cam.ac.uk/

(4)CATH

http://www.cathdb.info/

(5)Swiss-Model——蛋白质结构建模

https://swissmodel.expasy.org/

5. 了解主要蛋白家族的信息

有一些蛋白质家族是某些领域的研究热点,其相关信息有以下数据库进行收集整理。

(1)IMGT——免疫遗传学数据库,收录免疫球蛋白,T细胞受体等蛋白家族

http://www.imgt.org/

(2)REBASE——限制酶和相关蛋白的数据库

http://rebase.neb.com/rebase/rebase.html

(3)CAZy——研究降解、修饰和生成糖苷键的酶

http://www.cazy.org/

(4)MEROPS——蛋白酶数据库

https://www.ebi.ac.uk/merops/

(5)SPP——用于研究细胞信号通路的多组学数据库

https://signalingpathways.org/index.jsf

今天才知道,原来Swiss-Prot数据库中的检查工作都是Amos Bairoch一人或者他的团队完成的啊。与NCBI不同,NCBI是上传人对自己上传的信息的准确度负责;而Amos Bairoch可以对Swiss-Prot中数据随时修改,审核,注释。想想都是一个很大的工作量。这种一人扛起一个数据库的情况在一些创建比较早的老数据库中是很常见的。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,335评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,895评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,766评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,918评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,042评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,169评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,219评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,976评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,393评论 1 304
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,711评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,876评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,562评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,193评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,903评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,142评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,699评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,764评论 2 351