2019-11-12蛋白鉴定攻略之--搜库只搜目标序列?

转发自http://crickcollege.com/news/91.html

做蛋白质组学的小伙伴们可能都有这样的感受,利用质谱技术进行蛋白鉴定,是件既简单又复杂的事情。

为什么会说它既简单又复杂呢,不要急,下面小编跟你一一道来!

image
image

说简单,是因为它的原理无非就是通过各种方法把蛋白序列打碎,通过质谱收集信号(谱图),然后用软件进行数据库搜库,将实验得到的谱图与理论预测的谱图进行比对,从而得到目标蛋白的序列信息即可。

image

说复杂,这里面有太多的因素影响搜库结果的准确性,比如目标蛋白的峰度、酶切效果、肽段碎裂方式、蛋白修饰、母离子及子离子质量偏差等等。关于蛋白鉴定的各种技巧和攻略,小编打算开一个专题系列跟大家慢慢聊。

今天,我们先来聊一下蛋白鉴定时,在样品比较简单或者有了明确目标蛋白的情况下,能否只搜目标蛋白库,以及我们需要考虑的各种影响因素。

话说,2015年7月Nature Methods上发表了一篇题为"Mass spectrometrists should search only for peptides they care about"的文章。

image

在搜索某一物种或在全库中指定物种搜索时,我们通常建议加入常见污染蛋白序列。而这篇文献的观点,乍一看,与我们常规的做法似乎大相径庭!

细细读来,发现该文章的研究主要与疟疾有关,样品会同时包含人和疟原虫的蛋白。作者发现,如果只对疟原虫蛋白感兴趣的话,在固定FDR的情况下,只搜索疟原虫数据库会使鉴定结果的灵敏度得到提高!而主要原因是疟原虫数据库的搜索空间仅仅为人蛋白和疟原虫蛋白联合库的三分之一。

image

只搜索疟原虫数据库这种做法是不是个好主意呢?其实并不绝对,这部分取决于你的实验是探索性的还是有针对性的。

文章中,作者指出"… focusing an experiment on a small, targeted collection of peptides necessarily eliminates the possibility of serendipitous, unexpected discoveries." 但如果我们假设该样品已经经过前期实验的良好表征,确定可以排除对人源蛋白研究的必要,这种情况下就可以只搜索单一的疟原虫数据库了么?

事情可能没这么简单!别忘了还有共享肽段的问题。比如人类和疟原虫间的同源性非常小,那么共享肽段对搜库结果的影响也小。然而,当两个物种间同源性较高时,存在共享肽段的蛋白将对分析结果产生很大的误差。

比如,在人类蛋白研究中,如果目标蛋白之一是HSA(人血清白蛋白),却不慎混入了BSA(牛血清白蛋白);或者,小鼠蛋白研究中关注的是上皮细胞的蛋白,却不慎掉入了人Keratin(角蛋白)。这些样品受到污染的情况时有发生。原文作者建议在数据库搜索时直接去掉这些可能的干扰蛋白搜库,但这对于大多数研究来说,属于掩耳盗铃的行为。

image

序列同源性比较:第一条序列为BSA,第二条序列为HSA,*号所在的位点表示相同的氨基酸残基。
图片来源:MOE分子模拟软件

image

3D结构同源性比较:红色表示HSA,绿色表示BSA
图片来源:MOE分子模拟软件

原文作者没考虑到的另一个更重要的问题是样品数据的复杂程度。如果数据中疟原虫来源的谱图占90%,而人源的只有10%,那么搜索疟原虫数据库自然可以提高灵敏度。但是如果其组成是10%的疟原虫和90%的人源蛋白,搜库灵敏度可能反而会大幅下降。

比如我们测试了一个90%牛痘蛋白和10%牛蛋白的数据,同时设定PSM 1%FDR质控,数据库为Swissprot。得到如下结果:

image

如果我们感兴趣的是牛痘蛋白,那么显然仅仅搜索病毒数据库会得到更好地灵敏度。如果我们感兴趣的是牛蛋白,而我们选择搜索哺乳动物数据库,你会发现灵敏度反而大大下降。具体到某些蛋白来说,举例如下:

image

通常来说,如果你能保证正确匹配的序列不被排除在外的话,缩小搜索空间一定会在等同FDR条件下提高灵敏度。如原作者的做法,缩小搜索的序列数据库,或者降低MS1容差值,或者去掉丰度较低的可变修饰设置。

反过来讲,如果你在缩小搜索空间的时候去除了大部分正确匹配的序列信息,那么在等同FDR下,结果的灵敏度则会变差,类似于上面所举的牛痘/牛蛋白的例子。

如果去除牛痘序列,则会去掉所有正确PSM中的牛痘相关结果。当数据库变小时,Decoy结果的得分一般也会相应降低,但这会有边际效应。使得当我们需要控制牛蛋白PSM的FDR为1%时,相应的阈值需要提的非常高,用来去除很大一部分Decoy结果,很明显这样会降低灵敏度。

正确的牛蛋白PSM的Mascot得分在搜索哺乳动物库和哺乳动物+牛痘库时是一样的,而相应的期望阈值expect value(或者是p-value及PEP值)都会在单独的哺乳动物库中得到更好的结果,原因就是相应的搜索空间会小一些。从这个意义上来说,匹配结果是不可靠的。表面上看是因为FDR的评估标准失去了足够的灵敏度,但目前来说,这又是一个普遍接受的质控标准,你想发文章的话,很难让审稿人接受一个高FDR的数据结果。

今天这篇知识短文,大伙儿觉得有帮助吗?喜欢的话,记得点赞,给小编一点鼓励哟!另外,文章中多次提到FDR,不知道大家对FDR的理解是怎样的程度。如果有深入学习的兴趣,请在下方留言给我们,留言够多的话,小编下次就来跟大家好好聊一下这无处不在的FDR!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,723评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,003评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,512评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,825评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,874评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,841评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,812评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,582评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,033评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,309评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,450评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,158评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,789评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,409评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,609评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,440评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,357评论 2 352

推荐阅读更多精彩内容