这篇小二区的文章你也能轻松学会

今天给大家分享的是一篇发表在Atherosclerosis (IF=4.255)上的文章Identification of a blood-based 12-gene signature that predicts the severity of coronary artery stenosis: An integrative approach based on gene network construction, Support Vector Machine algorithm, and multi-cohort validation,作者通过构建基因网络、向量机算法和多队列验证,筛选出基于血液的12基因标志,随后建立了列线图,可以预测冠状动脉狭窄严重程度。

Identification of a blood-based 12-gene signature that predicts the severity of coronary artery stenosis: An integrative approach based on gene network construction, Support Vector Machine algorithm, and multi-cohort validation

基因网络、向量机算法和多队列验证筛选出的基于血液的12基因标志可预测冠状动脉狭窄严重程度

https://space.bilibili.com/400148106

一. 研究背景

评估冠状动脉狭窄的严重程度对于冠状动脉疾病的治疗至关重要,由于心脏成像方法存在局限性,因此基于血液的生物标志物是新的预测方法,但目前的预测性能均不佳,故而识别新的分子标志以反映冠状动脉狭窄十分必要。

近年来,基于血液的基因表达评分(GES)被认为是预测冠状动脉粥样硬化的一种有前途的生物标记物策略,但目前没有良好的可重复的基因标志。作者以基因表达综合数据库(GEO)为基础,通过加权基因共表达网络分析(WGCNA)和蛋白互作网络(PPI),筛选出核心基因,并通过两个独立验证队列进行验证,最后建立了基于GES12的列线图。

二. 分析流程

三. 结果解读

1. 通过WGCNA在发现集中构建网络

表1. 发现集、训练集和验证集的临床数据

发现集:GSE12288

作者从GEO数据库下载基因表达谱数据(GSE12288),并仅对其中110名冠心病(CAD)患者的数据进行分析。首先通过平均联动层次聚类确定其中离群样本(GSM308690)并移除(补充图2A),利用剩余的109个CAD样本建立WGCNA模型,选择β=3为软阈值(补充图2B),鉴定出11个共表达模块(补充图3、图1A)。

补充图2. WGCNA建模过程

软阈值的选择:本文中作者以R²=0.9画线,选择最靠近这条线的power作为软阈值,图中为3

图1A. 基于差异度量的网络树状图和已识别模块的颜色

补充图3. WGCNA中基因模块

作者对每个模块的特征基因进行多变量线性回归分析,发现棕色模块的特征基因水平与Duke指数显著相关(图1B),随后对棕色模块进行功能富集分析(图1C)和基因-疾病相互作用分析(图1D),以显示其生物学过程和相关疾病。

图1B-D. 筛选棕色模块

B:模块特征基因与Duke指数的相关性矩阵图,只有棕色模块表现出显著相关性(p<0.05)

C:棕色模块的功能富集分析,与冠心病相关,涉及到炎症、氧化应激、一氧化氮生物合成等

D:基因-疾病相互作用分析,与心血管疾病相关,包括动脉粥样硬化、血管疾病、冠心病等

综合以上结论,作者接下来在含有1148个基因的棕色模块中选择核心基因。

2. 棕色模块核心基因的鉴定

作者通过WGCNA(补充表3)以及PPI网络(补充图4)在棕色模块中分别筛选出30、47个核心基因。

补充表3. WGCNA筛选出的核心基因

筛选条件:1) 模块隶属度>0.75;2) 相关系数(绝对值)>0.2;3) FDR<0.05

补充图4. PPI网络筛选出的核心基因

筛选条件:degree>4

并通过取其交集进一步确定了15个核心基因(补充图5A)。

补充图5A. 确定核心基因

随后通过聚类分析来验证结果,发现这15个基因将109个CAD样本分为两个样本簇(补充图5B),且两个样本簇间的Duke指数存在显著差异(补充图5C),满足基因标志的前提。

补充图5B-C. 核心基因的检验

3. 构建可以预测冠状动脉狭窄严重程度的GES12

训练集:来自河南省郑州大学第一附属医院的151名冠心病患者

作者在训练集中,用RT -PCR定量分析了15个核心基因的表达,并根据Duke指数的中位数将冠心病患者分为两组,支持向量机(SVM)算法显示,12基因组合在预测Duke指数方面表现最好(图2A、补充表4、补充表5)。

图2A. n基因标志的预测准确性

补充表4. n基因标志的预测准确性

列出了图2A中的详细数据,其中GES12准确性最高

补充表5. GES12的组成基因

logistic回归分析显示,所有12个基因的表达水平都与Duke指数显著相关(表2)。

表2. 15个核心基因与Duke指数的相关性研究

为了测试这12基因标志是否存在过度拟合的风险,作者依次移除每个基因来进行敏感性分析(图2B)。

图2B. 移除单个基因之后的AUC对比

无论移除哪个基因,AUC均会减小,说明12个基因中的每一个对于预测更高的Duke指数都是必不可少的

最后作者利用单因素logistic回归得到的相应系数对12个基因的表达水平进行加权,建立了GES12的风险评分模型:

β:单因素logistic回归得到的各个基因的相关系数(表2)

E:各个基因的表达量

图2C. GES12的预测性能

GES12的最佳切点为4.983,即以4.983区分高/低风险组,对应的最大Youden指数为0.460,特异性为0.747,敏感性为0.713

补充表6. GES12在不同方面的预测价值

4. GES12预测疑似冠心病患者冠状动脉狭窄程度的内外验证

内部验证集:从河南省郑州大学第一附属医院招募的209名患者

外部验证集:从湖北省武汉大学中南医院招募的206名受试者

作者进一步在两个数据集中验证GES12的预测性能(图2D-I)

图2D-I. GES12的预测性能

D、G:两组验证队列均显示出GES12可以用于预测Gensini评分和Sullivan评分

E、H:校正曲线显示GES12的预测值与实际观测值吻合良好,说明GES12模型拟合良好

F、I:与低风险组相比,高风险组的患者Gensini评分和Sullivan评分普遍更高

5. GES12对梗阻性冠心病的诊断价值以及对血管重建的预测性能

补充表7. CAD风险因素对GES12预测CAD事件性能的影响

图3. GES12预测梗阻性CAD的性能

A-B:GES12有效区分梗阻性CAD患者与非CAD受试者,且不会受到心血管危险因素的影响(补充表7)

C-D:当冠状动脉造影中定义梗阻性CAD的参考标准设定为狭窄程度55%-75%时,由AUC确定的GES12的诊断性能高于0.75,但在狭窄程度80%-90%的极端标准下GES12的诊断性能略降至0.71-0.72

E-F:在基于血管的分析中,评估了GES12在三个主要冠状动脉中的鉴别性能,ROC曲线显示了相似的AUC,用于检测左前降支(包括左主冠状动脉)、左回旋支和右冠状动脉处>50%的狭窄(图3E和F)

G-H:在血管造影后的30天随访中,两个验证队列中约58%的患者接受了外科或经皮血管重建(表1),GES12预测血管重建的AUC约为0.77

6. 根据GES12和传统心血管危险因素建立列线图

补充表8. 冠心病患者Duke指数增高的独立风险因素分析

作者综合了Duke指数较高的独立风险因素(补充表8),包括GES12、吸烟状态、高血压状态、低密度脂蛋白胆固醇(LDL-c)水平和体重指数(BMI),开发了一个临床应用的列线图(图4A)。

图4A. 基于GES12的临床列线图

图4B-C. 列线图与GES12的性能对比

B:列线图展现出了比GES12更高的判别优势

C:决策曲线分析显示出列线图在几乎所有风险阈值范围内具有更大的净效益

作者还在训练集中比较了列线图和GES12的分类性能。

补充表9. 训练集中列线图的重新分类能力

151名患者中,57名(38%)被列线图重新分类,其中41名(72%)重新分类正确,只有16名(28%)重新分类错误,展现出了比GES12更好的分类性能

在两个验证队列中,列线图在鉴别冠状动脉狭窄(补充图6)、临床实用性(补充图7)和风险重新分类(补充表8)方面也显示出更加良好的性能。

补充图6. 列线图鉴别性能

在Gensini评分、Sullivan评分和梗阻性CAD中,列线图都展现出了良好的鉴别性能

补充图7. 列线图的决策曲线分析

在Gensini评分、Sullivan评分和梗阻性CAD中,列线图也展现出了良好的净效益

补充表9. 内外验证集中列线图的重新分类能力

7. GES12与斑块表型的关系

由于动脉粥样硬化病变不仅取决于管腔狭窄的程度,还取决于斑块表型,作者进一步评估了GES12与血管内超声检查(IVUS)所定义的斑块特征之间的关系,作者通过单尺度IVUS在152例患者中共鉴定出202个病灶。

补充表11. GES12与斑块表型相关

基于病变的分析发现,GES12所定义的高风险组的斑块负荷以及体积均高于低风险组

补充图8. GES12和列线图与斑块标志物的相关性

在基于患者的分析中,GES12或GES12衍生的列线图对VH-IVUS定义的薄帽纤维化动脉瘤(TCFA)和斑块负荷有着良好的鉴别能力

以上结果表明GES12与斑块标记物之间可能存在联系。

小结

        作者通过从GEO数据库检索的全血基因表达谱,进行WGCNA,并结合PPI和RT-PCR筛选出12个核心基因,产生基于血液的12个基因表达评分(GES12),并在两个独立验证队列进行验证,最后建立了由GES12和四个传统心血管危险因素组成的列线图,进一步提高GES12预测冠状动脉狭窄严重程度的风险再分类的准确性和临床实用性。同时作者还发现GES12与斑块表型相关,具有潜在的研究意义。

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,589评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,615评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,933评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,976评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,999评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,775评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,474评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,359评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,854评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,007评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,146评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,826评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,484评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,029评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,153评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,420评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,107评论 2 356