最近看到了越南的一个基因测序公司-Gene Solutions-发表的泛癌早筛的文章,深入了解了一下该公司及其产品,发现该公司蛮有实力。
该公司2023年B轮融资了2100万美元用于扩张其在东南亚的市场,鉴于越南的物价水平估计只有中国的一半,这些钱相当于国内的3亿人民币了,对比国内相关企业,裁员/降薪比比皆是,老美不提,啥时候越南也比咱好混了。。
该公司开展的业务很广,主要产品是NIPT以及癌症检测产品,覆盖了癌症从早筛到MRD再到伴随诊断的方方面面,产品线相当全了。该司已经积累了相当数量的样本,累计样本数据15w+,可以覆盖到越南50%的癌症患者,越南总人口接近1亿,市场很大。
下面主要介绍一下其早筛产品,即上图中的SPOT-MAS(screening for the presence of tumor by methylation and size),相关文章2023年发表在Elife期刊[1]。
有意思的是它结合了两种不同的路线:甲基化靶向测序(深度约55x,参考国内泛癌早筛产品梳理之甲基化靶向测序篇)+ 低深度全基因组甲基化测序(low-pass WGBS深度约0.5x,技术路线同臻和,相比臻和使用酶转,其仍使用重亚硫酸盐进行转化,理论上会损失一些片段化信号。参考国内泛癌早筛产品梳理之低深度全基因测序篇)。
不过既要做甲基化靶向测序又要做low-pass WGBS的话需要两套独立的建库测序和数据分析流程,并且需要的血样会更多,成本略高。插一句,其使用华大的测序仪进行的测序,华大威武,能挣外国人的钱才牛。
甲基化标志物:其甲基化靶向测序只测了450个甲基化标志物,大部分来源于鹍远生物2020年发表在Nature communications上的PanSeer[2](这都公开,良心那!),参考鹍远文章,这些标志物着重于癌症的鉴别,并没有强的组织溯源信号。纳入标志物的数量也远远少于Grail(10w+),燃石医学(7000+),鹍远后续的GutSeer(1600+)。
建模特征:捕获Panel只使用了特征AMF(平均甲基化比率),low-pass WGBS使用的特征与臻和大体一致,但是多加了一个GWM(genome-wide methylation),即基因组水平的甲基化比率,计算方式和AMF一样,只是因为深度很低,区域长度设置比较大(捕获Panel甲基化区域一般200bp左右,low-pass WGBS长度可达1M(1,000,000 bp)甚至更长) 。
机器学习模型:癌症模型使用同臻和和世和类似,使用集成机器学习模型,组织溯源则使用了深度学习模型。
建模样本 :纳入了738癌症患者和1550健康对照,其中纳入癌种及数目:乳腺癌(223),结直肠癌(159),胃癌(98),肝癌(122)和肺癌(136)。癌症分期只有I/II/IIIA偏早期的患者,未知分期患者也全部是未发生转移的偏早期的患者,很合理。将这些样本大体按照2:1的比例分为了训练集(Discovery cohort)和测试集(Validation cohort)。
虽然Cancer与Healthy之间年龄未进行匹配,但是其后期将模型分值同年龄做了相关性分析,未有显著相关性。
癌症检测性能:测试集中,在97%的特异性下可以达到72.4%的敏感性,同样肝癌敏感性最高,达到91.1%,乳腺癌敏感性最低,只有49.3%,肺癌表现还不错,达到83.7%的敏感性。
组织溯源性能:测试集中,组织溯源整体准确率达到了70%,乳腺癌虽然敏感性最低,但是组织溯源准确率却最高,达到78%。胃癌准确率最低,只有55%。
总结: 越南Gene solutions的这篇文章实验设计和数据都做的蛮扎实的,不比国内同行差,国内同行需要更加努力了。
该产品详细信息可查看该司官网: https://genesolutions.vn/en/product/spot-mas/
参考文献:
- Nguyen, T.H., et al., Multimodal analysis of methylomics and fragmentomics in plasma cell-free DNA for multi-cancer early detection and localization. Elife, 2023. 12: p. RP89083.
- Chen, X., et al., Non-invasive early detection of cancer four years before conventional diagnosis using a blood test. Nat Commun, 2020. 11(1): p. 3475.