数据分析:质谱数据初认识

背景知识

细胞内蛋白质组丰度的动态变化对不同生命过程有重要影响。例如在许多疾病的发生和发展进程中,常常伴随着某些蛋白质的表达异常。目前定量蛋白质组学技术主要分为标记(label)策略和非标记的(label free)定量策略,其中标记策略又分为体内标记(如 SILAC、15N 标记),以及体外标记(如 iTRAQ、TMT 标记) 。

非标记定量(label-free)蛋白质组学技术是通过液质联用技术对蛋白质酶解肽段进行质谱分析,该技术不需要使用昂贵的稳定同位素标签做内部标准,只需分析大规模鉴定蛋白质时所产生的质谱数据,比较不同样品中相应肽段的信号强度,从而对肽段对应的蛋白质进行相对定量。

软件

转换

赛默飞的raw数据格式需要转换,可以使用MSconvert或ThermoRawFileParser等软件。

在获取图谱过程中,常会用到2018年才推出的FAIMS(High-Field Asymmetric Waveform Ion Mobility Spectrometry)技术以用于加载不同电压(肽段在ESI离子化后,进入质谱之前实现快速气相分离,提高分离的峰容量),直接使用多电压下的raw data做MaxQuant定量分析是错误的,MaxQuant软件只能识别单电压的raw data,因此需要使用FAIMS MzXML Generator 软件将raw data转换成各自电压下的MzXML文件。

质控

IQuant 原华大质谱组员工闻博撰写,其输入MGF文件基于Mascot(收费软件)。

搜库

MaxQuant,MSGFplus,Comet。前一个最好用win版本,后两个用linux版本,然后后两个是最好用主流的质控软件。

收费软件:Proteome Discoverer, Mascot。

后期处理

Percolator
Perseus

评估质谱数据

第一种是实验手段,用MALDI-TOF预先评估样本的蛋白含量水平。

第二种就是直接做完鉴定之后看谱图识别率或者蛋白CV。

proteoQC

该软件结合参考蛋白质数据库,对MGF(Mascot Generic Format files)格式的文件进行质控处理,最后得到多个质控信息。

搜索数据库选择

不关注变异蛋白质可以使用Human data was queried against the UniProt’s Complete HUMAN proteome;否则需要根据特定组织类型选择对应的背景数据库找到变异蛋白。

  • uniprot/swissprot只包含非变异序列 ;
  • 患者的测序数据组装之后翻译成蛋白做ref;

下游分析

分析蛋白质表达谱,建议使用LFQ或iBAQ intensity,不建议直接使用intensity。

  • Protein intensity. For protein groups, this is the sum of all identified peptide intensities for the group. Peptide-feature intensities are taken at the peak maximum over the elution profile and include all isotopic peaks.
  • LFQ intensity. This is the relative protein quantification across all samples, and is represented by a normalized intensity profile that is generated according to the algorithms described in Cox et al. The LFQ intensities will form a matrix with the number of samples and number of protein groups as dimensions.
  • iBAQ protein intensity. Intensity-based absolute quantification is an approximation of protein copy numbers based on the sum of peptide-feature intensities of all peptides matching to a protein divided by the number of theoretically observable peptides.

相关R包

R for proteomics

参考

  1. 质谱测序简介
  2. 蛋白质组学定量软件
  3. 蛋白质组学数据分析基础
  4. ThermoRawFileParser质谱raw格式转换mgf
  5. MaxQuant参数设置
  6. 蛋白组学下游分析
  7. Bioconductor的质谱蛋白组学数据分析
  8. MaxQuant结果解析
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,717评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,501评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,311评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,417评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,500评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,538评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,557评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,310评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,759评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,065评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,233评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,909评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,548评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,172评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,420评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,103评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,098评论 2 352

推荐阅读更多精彩内容