最新6.5分纯生信,基于同源重组缺陷的分型和机器学习建模,内容不多但模型效果很好!

杂志:npj Breast Cancer

影响因子: 6.5

研究概述:

作为所有激素受体和HER2检测均为阴性的乳腺癌肿瘤,三阴性乳腺癌 (TNBC)具有高度异质性,可以划分为多种亚型,每种亚型都有不同的治疗方案。其中,PARP抑制剂(DNA损伤剂)已被批准用于TNBC中具有BRCA1/2有害变异的个体(gBRCAm)。在乳腺癌中,同源重组缺陷(HRD)是PARP抑制剂疗法的重要生物标志物。在患有HRD的肿瘤中,这些DNA损伤因子会导致突变的积累,导致合成致死最终致使细胞死亡,因此通过利用同源重组缺陷(HRD)作为潜在的生物标志物进行TNBC亚分类成为一种可能性思路。

作者对所收集的样本进行了基因组和转录组学测序,随后使用HRD相关的基因组突变特征对TNBC样本进行聚类来定义HRD状态,比较高低HRD组间的差异基因表达。作者发现了一组与HRD相关基因,并利用机器学习法构建预测模型,该模型可以精准分类出患者的HRD状态。在使用其他数据集和临床样本进行验证后,作者提出该HRD分类模型可作为非gBRCA却伴随着高HRD并且能从铂类化疗或PARP抑制剂治疗受益病人的区分手段。

研究结果:

TNBC样本中HRD基因组特征的聚类和基因表达分析

作者将收集的样本进行全外显子组测序,利用HRD相关基因组特征,包括 COSMIC 单碱基替换突变特征3 (SBS3)、短插入和缺失 (indels)、杂合性丧失 (LOH)、端粒等位基因失衡(TAI)、大规模跃迁(LST)以及拷贝数放大、缺失、增益和损失共10个特征进行无监督聚类分析。这些基因组特征的聚类将患者样本划分为两个不同的组(图1A)。随后,对两组进行差异基因表达分析,筛选到217个与HRD相关的基因(图1B),同时对以上基因进行富集分析,发现高HRD组的样本中细胞周期和DNA修复通路上调。


利用机器学习法使用获得的差异表达基因集构建HRD状态分类模型和验证

作者利用支持向量机和随机森林算法,使用的MyBrCa 队列中的数据为训练集,对以上217个差异基因进行训练,构建了HRD肿瘤样本分类器——HRD200集合分类器。该分类器在训练集和测试集中的平均AUROC为0.93(图2A)。图2B 是使用HRD200分类器对MyBrCa队列样本的分组与患者BRCA状态的比较情况。作者还比较了HRD200与其他文献中报道的预测模型的优越性,发现HRD200的预测效果优于使用 Peng和 i-SPY 2 的基因集所构建的类似分类器。


HRD200分类器在其他队列和平台上的验证效果

为了进一步评估HRD200分类器的稳健性,作者还在其他队列如TCGA乳腺癌队列、METABRIC乳腺癌队列、Nik-Zainal(NZ-560)乳腺癌队列中进行验证,预测结果显示,对于归类为 HRD 高与 HRD 低的样本的比较发现,HRD 高样本在所有 HRD 相关变量(包括 LOH、TAI、LST、短插入缺失、CNA 和突变特征 SBS3)上的得分显着更高(图3A), 该分类器预测TCGA TNBC中HRD状态的AUROC值为0.84(图3B)。不仅如此,作者的分类器在来自 Nik-Zainal (2016) WGS 队列的 73 个 TNBC 样本和来自 METABRIC 队列的 306 个 TNBC 样本中也成功分离出具有HRD相关特征的样本(补充图)。


最后作者利用了来自NanoString nCounter 平台的数据, 评估在采用不同基因表达测量方法下HRD200的性能,同样,尽管使用输入原始数据较小的基因子集和不同平台的表达数据的情况下,HRD200的预测性能仍然稳健(图4)。


研究总结:

作者利用突变载量和其他基因组特征,先将TNBC样本分为两个簇,随后进行差异基因比较,分析得出与HRD相关的基因集,利用该基因集的表达结果作为输入数据,作者开发了一种集成机器学习模型分类器(HRD200),该分类器可以准确区分高HRD和低HRD的样本,这个模型无论是在其他数据集中还是其他平台如NanoString,该模型分类结果的一致性率非常高,HRD与铂类化疗或者PARP抑制剂疗法密切相关,因此该模型的建立可用于受益于铂类化疗或者PARP抑制剂治疗的高HRD患者。另外关键的一点是,于其他的突变检测分类器相比,该模型的输入数据为基因表达特征,大大降低了由基因组测序所产生的成本。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,657评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,889评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,057评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,509评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,562评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,443评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,251评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,129评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,561评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,779评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,902评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,621评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,220评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,838评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,971评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,025评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,843评论 2 354

推荐阅读更多精彩内容