宏基因组测序的吞吐量和准确性的最新进展使得对与疾病相关的特定微生物群的积极研究成为可能。人类微生物群与各种疾病的发展密切相关。此类疾病包括传染病[1,2]、代谢紊乱(如肥胖[3]、2型糖尿病[4]、呼吸系统疾病[5]、自身免疫性疾病[6]、精神或心理疾病[7,8]、胃肠疾病(如炎症性肠病[9])和肝病,如酒精性肝病、非酒精性脂肪肝、肝硬化和肝细胞癌(HCC)[10–12]。尽管我们有广泛的发现,但在发现这些疾病背后的途径以及在疾病病理生理学中的作用方面进展甚微。因此,使用其他类型的生物数据可以增强对特定疾病表型中的生物过程和微生物组功能的理解。现在有许多研究将人类的微生物组数据与基因组、表观基因组、转录组和代谢组数据联系起来[13]。在多种组学数据中,代谢组学还提高了我们在多种疾病状态下理解微生物组结构和功能的能力[14,15]。因为宏基因组包含比整个人类基因组中发现的更多的代谢基因,所以它在人类生理学中起着至关重要的作用,涉及到酶、代谢物和生物途径等因素。最近的几项研究已经将微生物组和代谢组学数据结合起来,以确定微生物组与人类疾病之间的不同机制。例如,Noecker等人[16]使用基于社区的代谢物潜在得分来估计微生物组的相对代谢产生或消耗能力,并试图识别关键微生物物种。该小组还比较了预测的和测量的代谢物,以确定人类和微生物群之间的相互作用。
人类微生物组的异常与多种肝病相关,包括肝细胞癌(HCC)。即使我们可以将特定的微生物与特定的疾病联系起来,也很难从机理上了解微生物是如何参与病理生理学的。在这里,我们试图揭示HCC相关微生物组与人类代谢组的功能潜力,已知人类代谢组在连接宿主表型和微生物组功能方面发挥作用。为了利用微生物组和代谢组数据集,我们提出了一种创新的、基于途径的分析方法,即用于微生物组和代谢组途径分析的层次结构成分模型(HisCoM-MnM),用于整合微生物组和代谢组数据。特别是,我们使用途径信息来整合这两个组学数据集,从而提供了关于宿主表型的不同生物层之间的生物相互作用的见解。将HisCoM-MnM分别应用于103名和97名HCC病和肝硬化患者的数据集,结果表明,除了组成这些途径的重要代谢组和宏基因组外,该方法还可以识别与癌症代谢重编程相关的HCC相关途径。