导读
背景:宏蛋白质组学数据分析面临着数据库庞大、计算配置要求高、蛋白精确注释难、参考基因组深度不足、数据可视化待优化等挑战。方法:基于MetaProteomeAnalyzer (MPA)和Prophane搭建一条龙分析流程,包括4个部分:蛋白序列数据库构建、多肽鉴定以及蛋白的推断和分组、蛋白注释(分类学/功能)和定量、结果可视化。
文献1:The MetaProteomeAnalyzer: a powerful open-source software suite for metaproteomics data analysis and interpretation. J Proteome Res. 2015
文献2:Challenges and perspectives of metaproteomic data analysis. J Biotechnol 2017
文献3:A complete and flexible workflow for metaproteomics data analysis based on MetaProteomeAnalyzer and Prophane. Nature Protocol 2020
官网(下载、教程):http://www.mpa.ovgu.de/
GitHub地址:https://github.com/compomics/meta-proteome-analyzer
MPA workflow
NP2020摘要
1 概念:
研究生物群蛋白质组成,加深对微生物群生物多样性和微生物与宿主/环境复杂功能互作的认识。
2 分析背景:
与纯培养蛋白质组研究相比,宏蛋白质组样品更复杂、参考数据库更加庞大,需要专业的分析方法。
3 分析方法:
两个开源解决方法:MetaProteomeAnalyzer和Prophane。可用数据库:NCBI, UniProt, EggNOG, PFAM, CAZy等。步骤:数据库创建,数据库检索,蛋白分组和注释,可视化。MPA是目前综合性最强、最详细、最灵活的蛋白质组分析方法。