Revealing the Immune Heterogeneity between Systemic Lupus Erythematosus and Rheumatoid Arthritis Based on Multi-Omics Data Analysis
基于多指标数据分析揭示系统性红斑狼疮和类风湿性关节炎的免疫异质性
发表期刊:Int J Mol Sci
发表日期:2022 May 5
影响因子:6.208
DOI: 10.3390/ijms23095166
一、背景
系统性红斑狼疮(SLE)以免疫复合物的形成和T细胞对组织的浸润为特征,是一种能引起器官损害的自身免疫性疾病。类风湿性关节炎(RA)以慢性滑膜炎和骨侵蚀为特征,也是一种器官特异性自身免疫性疾病。这两种自身免疫性疾病都可能危及生命,对人们的健康造成极大的伤害。
多种类型的免疫细胞在SLE和RA的发病机制中起作用,包括对于T细胞、B细胞、单核细胞、中性粒细胞、自然杀伤细胞(NK)、树突状细胞(DC)和多能间质细胞。在类风湿性关节炎(RA)和系统性红斑狼疮(SLE)中已经观察到IFN的异常水平和IFN信号通路的改变。
二、材料与方法
1、 数据来源
1) 大量的RNA-seq数据:患者外周血单核细胞的基因表达谱;SLE样本(SRR13988788,SRR13988789,SRR13988790,SRR13988791,SRR13988792,SRR13988793);RA样本(SRR13989061、SRR13989062、SRR13989063、SRR13989064、SRR13989065、SRR13989066);HC样本(SRR13988787、SRR13988795、SRR13988796、SRR13988798、SRR13989070、SRR13989072)
2) 单细胞RNA-seq数据:从GEO下载了PBMC scRNA-seq数据。1名RA患者、3名SLE患者和3名健康对照样本的PBMC scRNA测序数据分别来自GSM4819747、GSM4954811、GSM4954812、GSM4217720、GSM4954813、GSM5335490和GSM5335491
2、 分析流程
1) T细胞受体和B细胞受体谱系的构建和分析:使用TRUST4,能有效地从大量RNA-seq数据中重建T细胞和B细胞的免疫受体序列
2) 单细胞RNA-Seq数据预处理和细胞类别鉴定:预处理后结合系统性红斑狼疮、RA和HC条件下的PBMC scRNA-seq数据,共获得39446个细胞;对数据进行缩放,并使用PCA方法降低维度,选择前50个主成分进行下游分析;利用已经知道的marker基因来注释细胞亚群
3) 差异表达基因的鉴定以及功能和途径的富集分析:通过使用Seurat中的 "FindMarkers "功能识别每个细胞簇之间的差异表达基因;使用 "Doheatmap "功能来绘制每个免疫细胞簇的差异表达基因的热图;在两组中确定了不同免疫细胞亚型的DEGs,分别是SLE与HC和RA与HC;将SLE与HC组和RA与HC组的每个簇的DEGs导入Metascape进行KEGG、GO和反应组路径分析
4) 细胞与细胞之间的相互作用分析:采用R软件包CellChat来识别和可视化SLE、RA和HC条件下不同免疫细胞的细胞-细胞相互作用
三、实验结果
01 - T细胞受体重排分析
通过TRUST4算法的标准工作流程,从大量RNA-seq数据中提取了SLE组、RA组和HC组的外周血T细胞受体repertoires。在得到T细胞受体的免疫表型后,比较了SLE组、RA组和HC组的前10种克隆型。系统性红斑狼疮前10位克隆型的频率(31.41%)与HC组(29.25%)、RA组(23.08%)相比没有明显增加。同时,在前10个克隆型的频率方面,RA组和HC组没有明显变化,图2A显示了每个样本的前10个高频克隆型的框图。还分析了每个条件下CDR3氨基酸序列长度的分布情况,SLE、RA和HC最常见的CDR3氨基酸序列长度分别为15、16和16。系统性红斑狼疮组、RA组和HC组之间的CDR3氨基酸序列长度没有显示出明显差异(图2C)。Shannon-Weiner熵和InvSimpson指数都被用来评估CDR3氨基酸序列的多样性。在香农熵和InvSimpson指数(图2B,D)方面,RA组的CDR3氨基酸序列的多样性比HC组有明显增加,然而SLE组和HC组没有明显变化。
为了比较SLE组、RA组和HC组之间TRBV基因和TRBJ基因的使用频率,作者根据TRBV基因和TRBJ基因的共同使用频率生成了一个使用频率堆积图(图2E,F)。系统性红斑狼疮组的TRBJ2-6、TRBV10-2和TRBV3-1与HC组相比明显下降,而TRBV11-2、TRBV27和TRBV30在系统性红斑狼疮组的频率高于HC组。在RA组,TRBJ1-5、TRBV27、TRBV30和TRBV5-5的频率高于HC组,没有TRBV基因或TRBJ基因的频率比HC组低。除此之外,TRBJ1-6、TRBV10-3、TRBV29-1和TRBV3-1在系统性红斑狼疮组的频率低于RA组,而TRBJ2-3和TRBV4-3在系统性红斑狼疮组的频率高于RA组。
02 - B细胞受体重排分析
作者通过TRUST4算法从大量的RNA-seq数据中构建了B细胞受体谱。通过TRUST4算法的标准工作流程获得B细胞受体的免疫表型后,比较了SLE、RA和HC组的前10个克隆型。系统性红斑狼疮组前10位克隆型的频率(7.04%)与HC组(15.31%)相比明显下降,RA组(11.82%)与HC组(15.31%)相比也明显下降。系统性红斑狼疮组前10位克隆型的频率(7.04%)低于RA组(11.82%=)。图3A显示了每个样本的前10个高频克隆型的框图。还分析了每个条件下CDR3氨基酸序列长度的分布情况,SLE、RA和HC组的B细胞受体最常见的CDR3氨基酸序列长度分别为15、16和16,这与T细胞受体的分布相似(图3C)。Shannon-Weiner熵和InvSimpson指数被用来衡量SLE、RA和HC条件下CDR3氨基酸序列的多样性。SLE组CDR3氨基酸序列的Shannon熵高于HC组。然而,这一发现对InvSimpson指数没有统计学意义(图3B,D)。
为了比较SLE组、RA组和HC组中IGHV基因和IGHJ基因的频率,作者根据V基因和J基因的常见使用频率生成了一个使用频率堆叠图(图3E,F)。SLE组中IGHJ6、IGHV2-5、IGHV3-53、IGHV3-33、IGHV7-4-1、IGHV3-66和IGHV2-26的比例高于HC组,而SLE组中IGHV3-41的比例与HC组相比有明显下降。RA组IGHJ5、IGHV1-NL1和IGHV4-30-4的比例高于HC组,而RA组IGHV1-18、IGHV3-9、IGHV1-69、IGHV5-51、IGHV1-8和IGHV3-41的比例低于HC组。系统性红斑狼疮组的IGHJ2、IGHV1-18、IGHV3-9、IGHV2-5、IGHV3-74、IGHV5-51、IGHV3-53、IGHV3-33、IGHV1-46、IGHV7-4-1、IGHV1-8和IGHV2-70的比例高于RA组,而SLE组的IGHV3-30、IGHV3-13和IGHV4-30-4的比例则低于RA组。
03 - 单细胞RNA-Seq分析
为了全面了解系统性红斑狼疮、RA和HC组PBMCs的差异,分析了三个健康人和三个系统性红斑狼疮患者及一个RA患者的PBMCs的单细胞RNA-seq数据。经过严格的原始数据预处理,并使用典型校正分析(CCA)方法去除批次效应,收集了39446个细胞用于进一步分析(图4A)。经过归一化和主成分分析(PCA)降低维度后,使用t分布的随机邻居嵌入(t-SNE)方法,首先将所有细胞分成23个簇,然后将所有细胞可视化。然后,使用 "FeaturePlot "功能将所有标记基因的表达水平在各个聚类中可视化(图4C),这些聚类通过标记基因被分配到已知的细胞系(图4B)。计算了每个条件下每个簇的比例,生成了一个细胞比例的堆积图(图4D)。与HC组相比,RA组的CD8+T细胞和FCGR3A+单核细胞的比例明显增加,与HC组相比,SLE组的CD4+T细胞的比例明显减少。RA组的CD8+T细胞和自然杀伤细胞的比例高于SLE组。
04 - 不同免疫细胞的差异表达基因鉴定及功能和通路富集分析
每个聚类中特征最明显的基因被显示在热图中(图5A)。作者列出了每种免疫细胞类型的前3个差异表达基因如下,可用于未来的研究:(1)CD4+T细胞:LTB、IL7R和MAL;(2)CD8+T细胞:CD8B、NELL2和CCR7;(3)CD14+单核细胞:S100A9、LYZ和S100A8;(4)FCGR3A+单核细胞:FCGR3A、HES4和CDKN1C;(5)NK:NKG7、GZMB和GNLY;(6)B:MS4A1、CD79A和HLA-DRA;(7)DC:FCER1A、HLA-DPA1和HLA-DQB1;(8)血小板:PPBP、CLEC1B和GNG11。
然后,筛选了SLE组和HC组以及RA组和HC组之间各免疫细胞类型的差异表达基因。当比较SLE组和HC组时,发现血小板有195个差异表达的基因,树突状细胞24个,B细胞13个,自然杀伤细胞367个,FCGR3A+单核细胞20个,CD14+单核细胞86个,CD8+T细胞14个和CD4+T细胞29个。当比较RA组和HC组时,发现CD4+T细胞有23个差异表达的基因,CD8+T细胞有28个,CD14+单核细胞有35个,FCGR3A+单核细胞有27个,自然杀伤细胞有70个,B细胞有38个,树突细胞有33个。在血小板中没有检测到差异表达的基因。Metascape被用来单独分析多个差异表达基因列表,图5B,E中显示了前20个明显富集的术语。在SLE组和HC组的20个富集词中,有4个路径被8种免疫细胞类型所共享,包括 "细胞死亡的积极调节"、"对细菌的反应"、"炎症反应 "和 "中性粒细胞脱颗粒"。在RA组和HC组的20个富集词中,有2个路径被7种免疫细胞类型共享,包括 "SARS-CoV-2路径的网络图 "和 "对病毒的反应" 。Circos图显示了来自八个免疫细胞亚群的多个基因列表的基因是如何重叠的。图5C,D表示比较SLE组和HC组时,免疫细胞类型之间差异表达基因的重叠情况。图5F,G代表了RA组和HC组的免疫细胞类型之间差异表达基因的重叠情况。
05 - SLE组和HC组的MIF家族信号通路的表达情况
CellChat被用来比较SLE和HC组不同细胞群中MIF家族配体/受体对的信号传导强度(图6B)。可以推断,SLE组的细胞普遍表现出较低的连接水平,各种细胞类型之间的相互作用数量减少。MIF-(CD74+CXCR4)配体/受体对的和弦图显示,与HC组相比,SLE条件下的相互作用数量总体减少(图6A)。与HC组相比,CD4+T细胞与自然杀伤细胞、FCGR3A+单核细胞和CD14+单核细胞之间的相互作用消失,自然杀伤细胞、CD8+T细胞和两种类型的单核细胞之间的相互作用也消失了。作者使用"netVisual_heatmap "功能来可视化SLE条件和HC条件下PBMC中各个细胞成分之间预测的信息流细节(图6C),然后用 "plotGeneExpression "功能来显示MIF家族细胞因子的表达水平,包括MIF、CD74、CD44和CXCR4(图6D)。注意到与HC组相比,SLE组的MIF在每个细胞群中的表达水平都有所增加。与HC组相比,SLE组的所有细胞类型中CD74的表达水平也显示出整体的增加。然而,与HC组相比,CXCR4和CD44的表达水平在SLE条件下的每个细胞群中显示出整体下降,每个细胞群中CXCR4和CD44的下降导致了MIF-(CXCR4 + CD74)和MIF-(CD74 + CD44)配体/受体对的减少。
06 - RA组和HC组的GALECTIN-9相关信号通路的表达情况
GALECTIN-9(LGALS9)是galectin家族的一个多功能成员,在各种细胞类型中表达,可以参与细胞的增殖、分化、炎症和免疫细胞的形成。GALECTIN-9可作为评估RA活性和治疗效果的新生物标志物。然而,与HC条件相比,在RA条件下不同类型的细胞之间包括LGALS9和CD45的相互作用还没有被很好地描述。作者使用CellChat来描述RA组和HC组中不同细胞群之间的相互作用。弦图显示,与HC组相比,RA组不同免疫细胞之间LGALS9和CD45的表达水平明显增加(图7A)。圆圈图总结了RA组和HC组各个细胞类型之间相互作用的最大数量(图7B)。最明显的特征是血小板和其他细胞群之间存在相互作用,如CD14+单核细胞、FCGR3A+单核细胞和树突状细胞。此外,与HC组相比,RA组的GALECTIN信号通路明显增强。使用 "netVisual_heatmap "功能来可视化预测RA组和HC组PBMC中各个细胞成分之间的信息流细节(图7C)。然后,使用 "plotGeneExpression "功能来可视化GALECTIN家族细胞因子的表达水平,包括LGALS9、PTPRC、HAVCR2和CD44(图7D)。与HC条件相比,LGALS9、PTPRC和CD44在RA条件下都被观察到在血小板中表达。此外,与HC组相比,LGALS9在RA条件下被观察到在B细胞和树突状细胞中都有表达。有趣的是,与HC组相比,HAVCR2在RA组的自然杀伤细胞中表达,而不是CD14+单核细胞和FCGR3A+单核细胞。所有这些发现与以前的研究结果一致,并揭示了在RA的发病过程中GALECTIN-9相关信号通路表达的特殊变化。
四、结论
本研究描述了系统性红斑狼疮和RA条件下TCR和BCR复合物的免疫特征。在系统性红斑狼疮组和RA组中检测到了免疫细胞组成和单个集群转录谱方面的异常变化,这突出了系统性红斑狼疮和RA条件下外周免疫环境中的免疫浸润影响。还在单细胞水平上确定了MIF-(CD74+CXCR4)和LGALS9-CD45这两个配体/受体对在SLE和RA的致病机制中的作用。