最新7+非肿瘤生信,机器学习筛选关键基因+样本验证。目前机器学习已经替代WGCNA成为筛选关键基因方法。非肿瘤生信分析欢迎咨询!

影响因子:7.31

关于非肿瘤生信,我们也解读过很多

目前非肿瘤中结合热点基因集,免疫浸润,机器学习,分型的分析是比较先进的。有需要的分析的朋友欢迎交流!!

研究概述:

心房颤动(AF)是缺血性卒中的主要危险因素,而仅凭临床特征和神经影像学表现都不能可靠地分类心源性栓塞性卒中(CE)。本研究旨在确定在心房颤动相关心源性栓塞性卒中(AF-CE)患者中具有诊断价值的新型潜在生物标志物,区分AF-CE与其他类型缺血性卒中。

研究者对AF和CE的共同的DEGs进行综合分析后,使用LASSO和SVM-RFE两种机器学习算法确定了三个诊断标志物C1QC、VSIG4 和 CFD。然后采用RT-qPCR分析了3种诊断标志物的表达水平,发现水平高低可用于区分AF-CE患者与正常对照组,并可有效区分AF-CE和LAA卒中。之后使用临床样本验证结果,并使用ROC曲线分析确定这些特征标志基因的诊断价值。最终得出C1QC、VSIG4 和 CFD 可作为 AF-CE 的独立因素和诊断标准。最后建立了列线图模型、开发了在线预测工具。

研究结果:

一、差异表达基因的鉴定

1. 在与CE相关的GSE58294 (GPL570)数据集中,与对照组相比,在中风后三个时间点(<3 h(图1a)、5 h(图1b)和24 h(图1c)分别筛选DEGs。同时,从GSE41177中获得13962个AF相关的DEGs (图1d)。

2. GSE58294数据集中不同时间点的DEGs结果的交集有418个DEGs (图1e)。该交集中的DEGs交叉得到316个AF-CE基因(图1f)。

3. 将GSE58294和GSE41177数据集合并为训练集,移除批处理效果后使用limma包获得13个AF-CE相关的DEGs基因(AP000525.9、POM121L9P、TIMM8A、MCEMP1、C1QC、LOC100996760、BCL2A1、S100A12、VSIG4、OLAH、ANKRD22、BMX、CFD),其中9个基因上调,4个基因下调(图1g)。

二、功能相关分析

1. 使用Metascape在线工具进行功能标注。结果表明:AF-CE相关的DEGs标志性富集于氧化应激诱导的衰老、氧化应激反应的调控、氧化应激反应的调控、细胞程序性死亡、上皮细胞增殖的调控、VEGFA-VEGFR2信号通路、补体和凝血级联、雌激素信号通路、snRNA 3’端加工、MHC II类蛋白复合物组装、细胞对生长因子刺激反应的调控、肌肉结构发育、白细胞介素-12的产生、癌症中的蛋白多糖、水杨酸与甘氨酸的偶联以及附肢形态发生(图2a)。

2. DO富集分析结果显示,AF-CE相关的DEGs主要与免疫介导的炎症性疾病(肝炎、乙肝、丙肝)和女性生殖系统疾病(女性生殖器官癌、卵巢上皮性癌、卵巢表面恶性上皮间质肿瘤、卵巢癌、泌尿系统癌)相关(图2B)。

三、利用LASSO和SVM-RFE算法选择诊断标记

1. 使用两种不同的算法(LASSO和SVM-RFE)从组合训练集(GSE58294和GSE41177)中筛选特征基因。SVM-RFE算法结果表明,当特征数为13,包含前文所述13个AF-CE相关的DEGs时分类器误差最小(图3a、 b)。

2. LASSO算法经过十倍交叉验证,选取10个基因,分别为AP000525.9、TIMM8A、S100A12、LOC100996760、VSIG4、C1QC、BCL2A1、OLAH、BMX、CFD(图3c、 d)。

3. 最终选择LASSO和SVM-RFE算法之间共有的7个特征基因(LOC100996760、VSIG4、C1QC、BCL2A1、OLAH、BMX和CFD)进一步分析(图3e)。7个特征基因的ROC分析AUC值均大于0.8,提示这7个基因可作为AF-CE患者的诊断标志物(图3f)。

4. 为进一步验证这7个候选诊断基因的可靠性和可重复性,作者合并了两个数据集(GSE115574和GSE14975)作为验证集。结果显示,CFD (P < 0.05)、VSIG4 (P < 0.01)和C1QC (P < 0.05)在AF和SR之间存在差异(图4a、b)。

5. 图4c 的ROC分析显示,三基因组合模型(C1QC+VSIG4+CFD)的AUC为0.794,高于单个基因的AUC:C1QC(0.672),VSIG4 (0.688),CFD( 0.671),组合模型具有较高的诊断价值。

6. 而动脉粥样硬化数据集GSE20129中C1QC、VSIG4和CFD的表达无明显差异(图4d -f)。从上述结果来看,特征生物标志物VSIG4、C1QC和CFD具有较高的诊断准确性。

四、特征生物标志物的通路分析

为确定VSIG4,C1QC和CFD的生物学相关性,作者从PathCards数据库进行富集分析。

结果表明,候选特征生物标志物主要富集于免疫应答凝集素诱导补体通路、纤维蛋白凝块形成(凝血级联反应)、C4和C2激活剂的产生、先天免疫系统、补体通路、补体和凝血级联、对血小板胞质Ca升高的反应2+和脂肪生成(图5a)。

故认为VSIG4,C1QC和CFD可能与AF-CE的调节细胞免疫反应有关,而细胞免疫反应又反过来影响AF-CE的风险。


五、免疫细胞浸润

1. 作者计算了GSE58294数据集中患者样本、脑卒中后<3、5和24h患者样本与对照样本之间免疫细胞浸润分布的差异。

①与对照组相比,AF-CE组在脑卒中后<3、5、24 h中性粒细胞升高;5 h 呈现M0、M2巨噬细胞升高;24 h 呈现T细胞γ δ和M2巨噬细胞升高。静息树突状细胞在脑卒中后3 h和5 h显著降低。

②幼稚CD4 T细胞在脑卒中后3h较低,嗜酸性粒细胞在脑卒中后5h较低,CD8 T细胞和静息NK细胞在脑卒中后24小时较低。(P 均< 0.05)

2. 对三个特征生物标志物,发现CFD(图5b)与中性粒细胞呈正相关,与幼稚B细胞、幼稚CD4 T细胞和静息NK细胞呈负相关。C1QC(图5c)与中性粒细胞和静息肥大细胞呈正相关,与静息树突状细胞呈负相关。VSIG4(图5d)与中性粒细胞呈正相关,与中性粒细胞、 T滤泡辅助细胞、静息树突状细胞和嗜酸性粒细胞呈负相关。这些结果与通路分析的结果一致。

六、临床样本中诊断基因的表达

为进一步证实,作者收集53份临床血样(20例LAA患者,20例CE患者和13例对照)进行qRT-PCR分析,检测C1QC、VSIG4和CFD的表达。如图6a-c所示,与健康对照相比,CE组和LAA组C1QC和VSIG4表达明显升高,而CFD表达降低。

七、C1QC、VSIG4 和 CFD 作为潜在AF-CE 生物标志物的评估

1. 构建ROC曲线以评价候选诊断基因的诊断准确性。(AUC越接近于1,真实性越高)

对照组CT与CE患者比较结果:(95%可信区间和p值见于图片,下同)

C1QC(图6d)的AUC为0.7885,VSIG4(图6e)的AUC为0.8769,CFD(图6f)的AUC为0.8250。

2. 对照组与LAA患者比较结果:C1QC(图6g)的AUC为0.8632,VSIG4 (图6h)的AUC为0.8423,CFD(图6i)的AUC为0.9219。

3. CE患者与LAA患者比较结果:C1QC(图6j)的AUC为0.7350,VSIG4(图6k)的AUC为0.9675,CFD(图6l)的AUC为0.7575。

4. 这些结果表明,C1QC、VSIG4和CFD表达在区分对照组、CE和LAA患者方面具有很大的价值,且对所分析的两种脑卒中亚型具有特异性。因此C1QC、VSIG4和CFD可能是AF-CE的诊断生物标志物。

八、AF-CE诊断列线图和在线预测工具的构建和评估

1. 基于3个诊断基因(C1QC、CFD和VSIG4),使用“RMS”包构建诊断AF-CE的列线图(图7a)。为更直观地评估列线图模型的临床效果,基于决策曲线分析(DCA)生成的曲线计算了临床影响曲线。AF-CE列线图(图7b)具有良好的区分效果,曲线下面积AUC为0.969(95%CI:0.940-0.991)。红色表示的高风险曲线与蓝色表示的真阳性患者曲线非常接近。这表明列线图模型能够且可以接受准确预测区别(图7c)。

2. DCA表明,C1QC+CFD+VSIG4曲线远高于灰线,这解释了列线图模型的高精度(图7d)。此外,还构建了校准曲线以确定列线图模型的预测能力。AF-CE的实际风险和预测风险之间几乎没有差异,表明预测AF-CE的准确性很高(图7e)。

3. 此外作者开发了一种在线预测工具用于临床应用,基于构建的列线图预测AF-CE的风险。将候选诊断基因(C1QC,CFD和VSIG4)的表达水平输入在线预测工具,结果表明所有AF-CE患者测试样本得分接近100%,而健康对照接近0%,这表明预测软件具有较高的描绘精度。

九、临床病理参数(包括年龄、性别、TIA、心源性疾病、心悸、呼吸困难、高血压、吸烟、左心房直径和糖尿病)与候选疾病生物标志物之间的相关性

1. C1QC表达与年龄>60岁、糖尿病史、高血压史、以及当前或近期吸烟呈正相关,而与患者其他临床病理参数无相关性(P > 0.05)。

2. 对于CFD的表达,在上述临床病理特征均有显著差异:糖尿病史与较低的CFD表达相关,女性表达低于男性,高血压史者表达较低。(P < 0.05)

3. VSIG4表达明显增高在高血压史、心源性疾病史、心悸史、吸烟者、年龄> 60岁、女性。(P < 0.05)

研究总结:

本研究首次探索了特定的基于血液的生物标志物C1QC、VSIG4 和 CFD,可通过机器学习快速诊断AF-CE患者,这可能有助于支持治疗计划和二级预防计划。此外,这些生物标志物主要富集在免疫系统和补体通路中,可能为进一步研究奠定基础。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,684评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,143评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,214评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,788评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,796评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,665评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,027评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,679评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,346评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,664评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,766评论 1 331
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,412评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,015评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,974评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,203评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,073评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,501评论 2 343

推荐阅读更多精彩内容