国内泛癌早筛产品梳理之甲基化靶向测序篇

医学技术近几十年有巨大进步,但是癌症仍旧无法被攻克。癌症既然现有技术难以攻克,那么最好的方法就是及早发现,及早治疗。早期癌症一般花几万块钱做一个小手术将肿瘤切除就可痊愈,五年生存率基本上可达90%以上,但是到了晚期,即使现在有很多昂贵的靶向药可以大大改善患者生存状况,但是也只是延长患者生存时间罢了,整体五年生存率不超过50%。NMPA(国家药品监督管理局)已经批准了不少单癌症诊断产品,主要了覆盖了肠癌,肝癌,肺癌等。单癌症产品一般基于qPCR平台,成本低,但一次只能检测几个靶点,性能相对有限。
泛癌种早筛只用一管血(大概10mL)就可检测多种癌症,可以说是癌症早筛领域的明珠。截止现在仍没有NMPA批准的产品。泛癌种早筛产品一般基于NGS平台,一次可以检测成千上万靶点,性能理论上更有保证,缺点是成本较高,但是一次能准确检测多个癌症的话,分摊到单癌症的成本其实不高,而且覆盖人群较广。
本文只介绍有相关文章或者Abstract较为详细数据支持的泛癌种产品,一些只自吹自擂产品性能,没有详细数据支持的自嗨产品不予考虑,但是即使有相关文章或者Abstract数据支持,产品的性能数据也不一定完全可信,你懂得..这年头会做PPT的太多了。。。
泛癌种早筛的技术路线主要有以下三个:甲基化靶向测序,低深度全基因组甲基化测序,低深度全基因组测序。

首先介绍甲基化靶向测序产品:甲基化靶向测序首先要筛选具有癌症和组织溯源信号的甲基化标志物,筛选标志物一般使用尽可能覆盖更多CpG位点的组织测序数据:比如450k/850k甲基化芯片数据,RRBS/WGBS测序数据,现有不少公共数据可下载使用,也可自己收集样本进行测序分析。筛选在血浆中具有显著信号的标志物需要考虑众多因素,这里只大概说一下,后续可以单独写一章。筛选到的甲基化标志物就可以组成一个Panel,后续使用扩增子靶向捕获测序或者探针靶向捕获测序。这样就可以用于血液cfDNA的检测,在训练集血浆样本的cfDNA甲基化数据中提取甲基化的相关特征构建机器学习模型或者深度学习模型,构建的好的模型再在真实世界中进行大规模前瞻性验证,只有在真实世界数据中达到预期才能称为一个合格的泛癌早筛产品。

国际领先的Grail公司的泛癌种早筛产品Galleri就是使用该路线,与之对标的国内同样使用该策略的公司是燃石医学和鹍远生物:燃石医学:

燃石医学:
2021年启动了两个万人前瞻性泛癌早筛临床实验PREDICT和PRESCIENT:两个临床实验都是院士主导,计划入组人数都在1万+。除了参与者/合作医院的差异,主要差异应该还是覆盖癌种数目的差异,PREDICT开发测试覆盖≤10个主要高发癌症早筛产品的性能;PRESCIENT开发测试覆盖≥20个癌种早筛产品的性能。自不必说,覆盖癌症越多,收集样本,筛选甲基化标志物和建模就会更难,价格肯定会更高。


Figure 1.png

Figure 2.png

目前,燃石已经有上市的泛癌早筛产品—燃小安,是中国目前唯一进入NMPA创新审评通道的多癌种早期检测产品,当然想要拿到正式证书还比较远。

该产品验证文章[1]发表在了著名期刊ANNALS OF ONCOLOGY,影响因子高达50.5,覆盖了6个癌种:肠癌,食管癌,肝癌,肺癌,卵巢癌和胰腺癌。

Figure 3.png

研究路线见下图,其筛选甲基化标志物的数据是TCGA数据库下载的组织样本的450k芯片数据和从GEO数据库下载的血细胞(WBC)450k芯片数据用来控制背景噪音,450k芯片虽然覆盖了45万个CpG位点,但是占人基因组全部CpG位点(2800万+)不足1/60,初始筛选标志物纳入的位点就有些少。
从大量的450k公共数据中一共筛选到了14,415个CpG位点,然后每个CpG位点上下游各外扩60bp,组成了包含7017个甲基化区域(161,984 CpG位点)的Panel,然后用自测的组织数据对这些标志物进行了验证,根据文章描述:其中有507个高甲基化标志物和59个低甲基化标志物在6个癌种中都有显著的癌症信号,2119个标志物在至少一个癌症中具有显著组织溯源信号, 应该也会有不一致的标志物,但文章并未提及,Panel后续也未缩减。
Figure 4.png

下一步在血浆样本中进行建模和独立验证。在建模阶段使用的回顾性研究样本,样本数目为700 cancers VS 914 non-cancers,训练集样本进行了年龄匹配(就是Cancer与non-Cancer样本的年龄分布一致,后续建模的话就不会带入年龄信号,而是真正的甲基化信号),6个癌种样本数目大体一致,早期(I/II期样本)样本占比在50%左右,甲基化特征的话文章只给了Methylation Region Score,可大体理解为该区域的平均甲基化水平,癌症模型和组织溯源模型分别使用了SVM(支持向量机模型)和逻辑回归模型,较为简单,都没有使用深度学习模型。
Figure 5.png

Figure 6.png

最后就是独立验证阶段,独立验证阶段使用前瞻性收集的样本,在此的一个操作我难以理解,独立验证集总的样本还是蛮多的(1433 cancers VS 1075 cancers),但是后续又在此基础上进行了年龄匹配,最后用的样本只有473 cancers vs 473 non-cancers。其在训练集建模时已经进行了年龄匹配,构建的模型理论上已经没有了年龄信号,为何在独立验证集还要继续匹配年龄。。。难道以后大规模应用查看性能的话还要匹配年龄之后再看。。。那匹配年龄过程中被删除的50%以上样本就不管死活了么。。
下面介绍一下该产品的主要性能指标:独立验证集中,98.9%的特异性下,在6个癌症中可以达到69.1%的敏感性, 组织溯源准确率可达到83.2%。但是对于单个癌种,性能差异则较大,除了肝癌,其它5个癌种I期的敏感性都很低(25%左右),II期患者敏感性稍高一些(食管癌/肺癌/胰腺癌敏感性仍只有35%左右), I/II期患者应是泛癌早筛产品最紧要的目标,性能还待提高。TOO溯源的准确率I期患者也较低,只有65%;另外就是肺癌的组织溯源准确率只有61.8%远低于其他癌种,性能也待提高。明显III/IV期患者拉高了整体的性能,晚期癌症患者一般都会有了相关症状,常规筛查手段就可发现,根本不需要泛癌早筛产品。
Figure 7.png

鹍远生物:
鹍远也有大型的前瞻性泛癌早筛临床实验-福声计划(FuSion),也是院士牵头,预计入组人数超过6万人,覆盖华东、华北、华南、西南等地区的10个省及直辖市,大手笔了。


Figure 8.png

Figure 9.png

关于泛癌种研究,迄今为止,鹍远发表了两个相关研究:2020年发表在Nature communications(IF=16.6)上的PanSeer的初步结果[2]和2023年的ASCO Abstract展示的GutSeer[3],GutSeer应该是PanSeer验证成型的一个产品。
首先介绍一下PanSeer的初步结果,覆盖了5个癌症(胃癌,食管癌,结直肠癌,肺癌和肝癌)。甲基化标志物的筛选也使用的组织测序数据,但是相比燃石只使用甲基化芯片数据,鹍远使用了更多来源的数据:甲基化芯片/WGBS/自测的RRBS数据, 另外还纳入了其它文献报道的标志物;但是只筛选了具有癌症信号的甲基化标志物,没有筛选能够组织溯源的标志物。虽然数据更多,但是只纳入了595个甲基化区域,后续又在用自测的组织样本对这些区域进行了验证,最后只留下了477个甲基化区域,覆盖了10,613个CpG位点,相比燃石的Panel要小很多。建模阶段只使用了AMF(Average Methylation Fraction, 平均甲基化水平)特征,只构建了癌症模型,使用了简单的逻辑回归模型。
样本来源的话全部是前瞻性收集的样本,并根据确诊时间对样本进行了分组。性能:在96.1%的特异性下,敏感性可以达到87.6%, 不同确诊时间分组中,都保持着超高的敏感性,所以文章宣称提前四年可以发现癌症信号,根据其模型分值的分布,并没有发现早期与晚期敏感性的差异,不同癌症之间敏感性的差异也没有像燃石那么明显。

Figure 10.png

Figure 11.png

下面再介绍一下鹍远最新的GutSeer,在此次Abstract并没有详细说明如何筛选的甲基化标志物,只说一共纳入了1656个甲基化区域,应该是在上述PanSeer 477个甲基化标志物的基础上,后续纳入了一些组织溯源的甲基化标志物,使用的建模特征,除了甲基化特征还纳入了cfDNA的片段化信号(CNV,endmotif),模型也要更复杂一些,使用了集成模型(合并了多个不同模型的分值进行建模),但是并没有展示详细建模信息。
GutSeer覆盖的癌种和PanSeer的初步结果有所差异,去除了肺癌,新纳入了胰腺癌,只检测跨消化道的5个主要癌种。研究共招募1844名受试者(其中:健康人787例、肝癌342例、食管癌209例、胃癌239例、结直肠癌180例、胰腺癌87例),随机分入训练集与测试集。研究发现,在测试集中GutSeer模型敏感性为86.2%,特异性为96.7%,总体溯源准确率达到了82%。同燃石的产品相比,牺牲了一定的特异性(96.7% vs 98.9%),但是敏感性大幅提升(86.2% vs 69.1%)。肝癌同样表现最好,敏感性最高,但是对于其它癌症,I/II期癌症的敏感性相比燃石产品则要好很多,所有癌症I/II期的敏感性都在50%以上,当然因为与燃石所纳入癌种不一致,样本也不一致,无法平行对比,并且GutSeer此处只是case-control研究结果,不是前瞻性盲测结果,后续还需在前瞻性验证集进行盲测验证。
有意思的是,此次GutSeer还与基于低深度全基因组测序(low-pass WGS)的方法进行了平行比对,两者在癌症信号的检测能力相近,但是组织溯源能力甲基化捕获Panel要优于WGS。
Figure 12.png

基于后两种路线的泛癌早筛产品路线(低深度全基因组甲基化测序,低深度全基因组测序),后续再单独介绍。

  1. Gao, Q., et al., Unintrusive multi-cancer detection by circulating cell-free DNA methylation sequencing (THUNDER): development and independent validation studies. Ann Oncol, 2023. 34(5): p. 486-495.
  2. Chen, X., et al., Non-invasive early detection of cancer four years before conventional diagnosis using a blood test. Nat Commun, 2020. 11(1): p. 3475.
  3. Yang, X.-R., et al., Detection and localization of gastrointestinal cancers based on multi-dimentional signatures from a single cfDNA targeted sequencing assay. 2023, American Society of Clinical Oncology.
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351

推荐阅读更多精彩内容