MetaX是一款专为宏蛋白质组学(Metaproteomics)设计的开源工具,能够将肽序列与分类学和功能信息相结合,以帮助研究人员解答微生物在生态系统中的角色和功能,即“谁在做什么以及怎么做?”。由宏蛋白质组学知名实验室NorthOmics Lab开发。
MetaX 引入了创新性的可操作生物-功能(Operational Taxon-Function, OTF)单元概念,能够将特定的微生物类群(如种、属、科等)与它们的生物学功能(KEGG, COG, GO等)联系起来,从而为我们探索微生物在复杂生态系统中的功能提供了一个全新的视角。
MetaX 的亮点功能
可操作生物-功能(OTF)框架:MetaX 引入了 OTF 概念,将特定微生物类群与其功能直接关联,帮助探索微生物在复杂生态系统中的功能角色。通过基于肽的比例阈值,实现了对肽与分类、功能的精确映射, 此外OTF连接允许用户自定义选择不同的生物分类水平和功能分类(如Species-KEGG,Genus-CAzy等)。
肽为核心的注释方法:MetaX 采用肽水平的注释方法,而不是传统的蛋白质为核心的方法,这种肽注释方式使得 MetaX 能够直接分析功能与分类之间的关联,从而在宏蛋白质组学中提供更高分辨率的理解。
数据库构建与多维注释:MetaX 提供了数据库构建和更新模块,支持从MGnify(涵盖人类、鸡、老鼠、鱼类、海洋等12个数据库)自动下载和注释蛋白质,以生成OTF表。此外,MetaX 也支持从多个数据库(如 dbCAN 等)导入注释数据,并允许用户自定义数据库,确保在功能与分类注释中使用不同的来源与方法,实现更为全面的注释。
多样化的统计与可视化工具:MetaX 具备一整套的统计分析与可视化工具,包括主成分分析(PCA)、热图、柱形图、桑基图、火山图、网络图等,可用于展示不同样本之间的功能差异及其相互关系,帮助研究者更直观地分析结果。
直观的图形用户界面(GUI)与命令行界面(CLI):MetaX 提供了图形用户界面,适合非编程用户,同时提供命令行接口供需要自动化分析的用户使用。无论是初学者还是经验丰富的研究者,MetaX 都能简化从数据准备到可视化的全流程操作。
OTF 示例
Taxa-Functions网络
展示选定样本和分组中所有的物种与功能的链接关系,如Species 连接的所有KEGG Pathways, 节点大小代码其丰度
物种的功能贡献
展示某个物种的全部功能在不同分组(样本)之间的功能贡献差异,可选热图、线图、柱形图等
功能的物种贡献
展示某个功能在不同分组(样本)之间的物种贡献差异, 可交互柱形图:
计算功能冗余(Functional Redundancy)
组间功能上没有显著性差异,但贡献此功能的物种在组间显著不同的OTF
组间物种上没有显著性差异,但此物种贡献的功能在组间显著不同的OTF
其他统计和可视化功能
MetaX包含了大量的统计和可视化工具,以及对数据筛选和过滤的工具,用户能够自由调整绘图参数。此外, 所有的结果支持导出为不同格式的图片(如PDF, SVG, PNG等)和表格,以用于后续的分析和调整。
任意表格模式
MetaX支持任意表格模式(Any Table Mode), 允许用户导入任意数据表格而不是仅限于宏蛋白质组学数据。可用的功能包括数据预处理、PCA、相关性、差异分析、共表达分析等。
下载安装
MetaX 提供桌面版和命令行版:
桌面版(推荐):包括所有必要的依赖项,适合需要快速上手的用户。可以从Northomics Lab网站以或者Github项目主页下载。
命令行版:通过以下命令安装,适合有编程经验的用户:
python -m pip install MetaXTools
总结
MetaX 作为一款宏蛋白质组学数据分析工具,以其独特的 OTF 框架和肽水平的注释方法,极大地提升了从肽到功能的解析能力。无论是需要直观可视化的初学者,还是追求高分辨率功能探究的资深研究者,MetaX 都为揭示微生物在复杂生态系统中的功能提供了强有力的支持。
本文仅介绍了MetaX的一小部分功能,更多详情与案例展示请查看文末参考内容。
参考内容:
项目主页:https://github.com/byemaxx/MetaX
详细使用文档:https://byemaxx.github.io/MetaX
NorthOmics Lab:https://www.northomics.ca