12-18 利用肿瘤HLA肽质谱数据集的深度学习改善肿瘤抗原鉴定

Deep learning using tumor HLA peptide mass spectrometry datasets improves neoantigen identification

题目:利用肿瘤HLA肽质谱数据集的深度学习改善肿瘤抗原鉴定

作者:

Brendan Bulik-Sullivan, Jennifer Busby […] Roman Yelensky

通讯作者单位:

Roman Yelensky

Gritstone Oncology, Inc., Emeryville, California and Cambridge, Massachusetts, USA.

发表期刊及时间:

Nature Biotechnology

Published: 17 December 2018

摘要:

Neoantigens, which are expressed on tumor cells, are one of the main targets of an effective antitumor T-cell response. Cancer immunotherapies to target neoantigens are of growing interest and are in early human trials, but methods to identify neoantigens either require invasive or difficult-to-obtain clinical specimens, require the screening of hundreds to thousands of synthetic peptides or tandem minigenes, or are only relevant to specific human leukocyte antigen (HLA) alleles. We apply deep learning to a large (N = 74 patients) HLA peptide and genomic dataset from various human tumors to create a computational model of antigen presentation for neoantigen prediction. We show that our model, named EDGE, increases the positive predictive value of HLA antigen prediction by up to ninefold. We apply EDGE to enable identification of neoantigens and neoantigen-reactive T cells using routine clinical specimens and small numbers of synthetic peptides for most common HLA alleles. EDGE could enable an improved ability to develop neoantigen-targeted immunotherapies for cancer patients.

肿瘤抗原在肿瘤细胞中表达,是有效的抗肿瘤T细胞应答的主要靶标之一。用于靶向新抗原的癌症免疫疗法越来越受关注,并且正处于早期人体试验的阶段,但是,鉴定肿瘤抗原的方法要么需要有攻击性的或难以获得的临床标本,需要筛选数百至数千种合成肽或串联小基因,或仅与特定人类白细胞抗原(HLA)等位基因有关。我们将深度学习应用于来自各种人类肿瘤的大量(N = 74名患者)HLA肽和基因组数据集,从而搭建一个用于肿瘤抗原预测的抗原呈递计算模型。我们的模型(命名为EDGE)将HLA抗原预测的阳性预测值提高了九倍。利用常规临床标本和少量合成肽,在大多数常见的HLA等位基因中EDGE模型的应用可以鉴定出肿瘤抗原以及肿瘤抗原反应性T细胞。 EDGE能够为癌症患者们提高开发肿瘤抗原靶向免疫疗法的能力。

图表选析

Figure 3: Architecture and features of the model. 图3. 模型的体系结构和功能。

(a) The architecture of our neural network (NN), with the subcomponents of the network active in a single patient with six HLA alleles. Pr, probability. (b) The learned dependence of HLA presentation on each sequence position for peptides of lengths 8–11 for two common HLA alleles. See Supplementary Figure 3a, b, c for learned motifs for all alleles. (c) Observed (dark blue) values are the proportion all detected peptides in the test samples found at each peptide length. Predicted (light blue) values are the sum of probabilities of all proteome peptides of length k over the total sum of probabilities of all peptides of lengths 8–11 (i.e., the expected proportion of presented peptides of each length). (d) Observed (dark blue) values are the proportion all detected peptides in the test samples found from genes at each mRNA expression TPM level. Predicted (light blue) values are the sum of probabilities assigned to all proteome peptides at the TPM level over the total sum of probabilities of all peptides. (e) Test set prevalence of detected peptides binned by learned per-gene propensity of presentation (x axis) and RNA expression (y-axis) of the source genes.

(a) 我们神经网络(NN)的体系结构,其中网络的子组件用了在具有6个HLA等位基因的一个患者。复杂度,概率。 (b) 对两个常见HLA等位基因,长度为8-11的肽的HLA呈递对每个序列位置的学习依赖性。所有等位基因的学习模块见补充图3a, b, c。 (c) 观察值(深蓝色)是测试样品中所有检测到的肽在每个肽长度的比例。预测值(浅蓝色)是在总的所有长度为8-11的肽段中,长度为k的所有蛋白质组肽概率的总和(即每个长度的呈递肽的期望比例)。 (d) 观察值(深蓝色)是测试样品中所有检测到的肽在每个mRNA表达TPM水平的比例。预测值(浅蓝色)是在TPM水平上分配给所有蛋白质组肽的概率与所有肽的概率总和的总和。 (e) 通过学习每个基因的呈递偏好(x轴)和RNA表达(y-轴)将检测肽的数据分箱,得到的测试集普遍性。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,444评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,421评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,363评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,460评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,502评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,511评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,280评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,736评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,014评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,190评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,848评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,531评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,159评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,411评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,067评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,078评论 2 352

推荐阅读更多精彩内容

  • 祝澜 焦点网络初级8期 分享129天 2018-5-5 看着老爸被疼痛折磨的样子,我心里有一种说不出来的难受...
    祝澜阅读 220评论 0 0
  • 1、active-class是哪个组件的属性?嵌套路由怎么定义? 答:vue-router模块的router-li...
    菲菲菲菲妞阅读 1,247评论 0 22
  • 什么都想吃 母亲没吃完的 我继续吃
    长山独白阅读 167评论 0 0