关于新抗原预测的一些知识点
- 新抗原预测的逻辑:
- HLA表达的抗原决定着机体的组织相容性。通过识别非己细胞的肽段可以呈递到T细胞进而杀死非己细胞。
- 癌症细胞具有大量突变,可能因此逃避HLA表达抗原的识别。
- 根据肿瘤样本中的大量突变(主要为编码区域的致病突变)预测突变后的氨基酸序列。在确定该患者HLA亚型下,找到突变氨基酸序列中与确定HLA亚型有强亲和力的肽段。
- 以上肽段更有可能作为HLA识别的区域,以便HLA结合该区域将肿瘤细胞呈递到T细胞并杀死。
- 涉及以上肽段作为新抗原,外来肽段进入体内诱发HLA识别呈递,启动免疫反应。进而教会HLA识别肿瘤细胞中的该肽段,重启杀死肿瘤细胞的机制。
(找了好久,想了好久,如果不是这样的逻辑还请指出)
- VAF:Variant Allele Frequency(变异等位基因频率)或Variant Allele Fraction(变异等位基因分数)。VCF文件中,DP代表Total Depth,AD代表Allele Depth。
VAF=AP/DP
- NetMHCpan结果解读:
- %Rank代表该肽段是一个天然存在的肽段的可能性,数值越小越好
- BindLevel:代表亲和力的强弱水平,SB表示strong binding, WB表示weak bingding。
- 官方按照Rank值来筛选结果,默认情况下rank小于0.5的定义为强亲和性,rank值在0.5到2之间的定义为弱亲和性(没看到Rank这一列,是不是直接过滤不显示了直接显示SB/WB)。
网页版结果如下:
# NetMHCpan version 4.1b
# Tmpdir made /usr/opt/www/webface/tmp/server/netmhcpan/5FB5CE42000043766BB371AD/netMHCpanWqS1WU
# Input is in FSA format
# Peptide length 9
# Make EL predictions
HLA-A02:01 : Distance to training data 0.000 (using nearest neighbor HLA-A02:01)
# Rank Threshold for Strong binding peptides 0.500
# Rank Threshold for Weak binding peptides 2.000
---------------------------------------------------------------------------------------------------------------------------
Pos MHC Peptide Core Of Gp Gl Ip Il Icore Identity Score_EL %Rank_EL BindLevel
---------------------------------------------------------------------------------------------------------------------------
1 HLA-A*02:01 MGQIVTMFE MGQIVTMFE 0 0 0 0 0 MGQIVTMFE LCMV_Armstrong_ 0.0000230 62.500
2 HLA-A*02:01 GQIVTMFEA GQIVTMFEA 0 0 0 0 0 GQIVTMFEA LCMV_Armstrong_ 0.0393910 3.356
3 HLA-A*02:01 QIVTMFEAL QIVTMFEAL 0 0 0 0 0 QIVTMFEAL LCMV_Armstrong_ 0.0123140 6.107
4 HLA-A*02:01 IVTMFEALP IVTMFEALP 0 0 0 0 0 IVTMFEALP LCMV_Armstrong_ 0.0005480 22.554
5 HLA-A*02:01 VTMFEALPH VTMFEALPH 0 0 0 0 0 VTMFEALPH LCMV_Armstrong_ 0.0001060 40.500
6 HLA-A*02:01 TMFEALPHI TMFEALPHI 0 0 0 0 0 TMFEALPHI LCMV_Armstrong_ 0.9425470 0.027 <= SB
7 HLA-A*02:01 IVITGIKAV IVITGIKAV 0 0 0 0 0 IVITGIKAV LCMV_Armstrong_ 0.3626600 0.598 <= WB
本地版结果如下:
allele seq_num start end length peptide ic50 rank
HLA-A*02:01 1 6 14 9 TMFEALPHI 4.38 0.02
HLA-A*02:01 1 137 145 9 TLMSIVSSL 7.27 0.05
HLA-A*02:01 1 440 448 9 LMFSTSAYL 8.36 0.06
HLA-A*02:01 1 435 443 9 ALMDLLMFS 10.53 0.09
HLA-A*02:01 1 447 455 9 YLVSIFLHL 11.33 0.1
HLA-A*02:01 1 45 53 9 ALISFLLLA 18.97 0.18
HLA-A*02:01 1 10 18 9 ALPHIIDEV 19.58 0.18
HLA-A*02:01 1 42 50 9 GIFALISFL 38.8 0.35
HLA-A*02:01 1 14 22 9 IIDEVINIV 51.87 0.47
HLA-A*02:01 1 38 46 9 FATCGIFAL 53.54 0.48
HLA-A*02:01 1 436 444 9 LMDLLMFST 80.28 0.71
HLA-A*02:01 1 349 357 9 SLISDQLLM 89.58 0.78
HLA-A*02:01 1 100 108 9 YISMGTSGL 102.98 0.86
HLA-A*02:01 1 13 21 9 HIIDEVINI 141.58 1.2
HLA-A*02:01 1 339 347 9 ALHLFKTTV 157.3 1.3
HLA-A*02:01 1 448 456 9 LVSIFLHLV 168.83 1.4
- 新抗原鉴定步骤:
选择等位基因频率(AF)>2%的体细胞突变来预测与患者HLAⅠ类和Ⅱ类结合的T细胞表位。
MHC class I限制的T细胞表位用NetMHC3.4/4.0 和 NetMHCpan3.0 预测。
MHC class II限制的T细胞表位用NetMHCII 2.2预测。
-
筛选强绑定:IC50<50nM or %Rank
IC50:“被测量的拮抗剂的半抑制浓度。它能指示某一药物或者物质,在抑制某些生物程的半量。在凋亡方面,可理解为一定浓度的某种药物诱导肿瘤细胞凋亡50%,该浓度称为50%抑制浓度,即凋亡细胞与全部细胞数之比等于50%时所对应的浓度,IC50值可以用来衡量药物诱导凋亡的能力,即诱导能力越强,该数值越低。”