这篇单基因套路文章如何发了小2区?

    大家好,今天和大家分享的是今年3月份发表在Shock(IF:3.083)的一篇非肿瘤生信文章,“S1PR1-associated Molecular Signature Predicts Survival in Patients with Sepsis ”,本文作者通过生信手段去分析败血症患者的预后与已知预后相关基因S1PR1的相关基因的关系,快来学习一下吧!

S1PR1-associated Molecular Signature Predicts Survival in Patients with Sepsis

S1PR1相关的特征基因预测败血症患者的预后

https://space.bilibili.com/400148106

一.文章背景

败血症(Sepsis)是在感染情况下可能产生的威胁患者生命的一种并发症,而研究表明磷酸-1-鞘氨醇(Sphingosine-1-phosphate,S1P)及其受体S1PR1是败血症可能的治疗靶点以及分子标志物。基于以上背景,作者在本文中通过GEO数据库中研究败血症患者的外周血芯片数据去识别S1PR1相关的特征基因并以此预测败血症患者的预后状况。

二. 文章思路

三. 结果解析

1.识别生存相关基因和S1PR1相关基因

作者从GEO数据库获取了GSE54514和GSE33118这两个研究败血症患者的外周血芯片数据集,样本组成如下,分为存活者和未存活者两类情况。其中GSE54514样本量多作为探索数据集,GSE33118则作为验证集。

表1. 数据集信息 1. 关于S1PR1相关基因的识别,作者通过两种方法

第一种方法是基因共表达分析(通过E-MTAB-4421数据集去分析,含265名败血症患者的芯片数据),作者通过分析基因表达量间相关性,找到557个与S1PR1有共表达关系的基因(表达量上调或下调的基因都被认为是S1PR1相关基因,|r|>0.4,FDR<0.05)。

第二种方法是用STRING数据库从蛋白质互相作用角度去分析和S1RP1相关的基因,一共找到233个基因与S1PR1之间在蛋白质层面有较高的互作分数(interaction score>0.7)。

关于与败血症相关的生存相关基因,通过在败血症非存活者样本(n=9)和存活者样本(n=26)间的差异分析寻找与寻找。一共分析出1078个表达量上调的基因和1134个表达量下调的基因(limma包,FC>1.2,FDR<0.05)。

        在找出两种方法的S1PR1相关基因后,分别于败血症患者的生存相关基因取交集(图1C,图2B),分别得到62个特征基因和16个特征基因。之后对两种方法得到的基因(图1A,图2B),生存相关基因(图1.B),以及取交集后的基因(图1.D,图2.C)做KEGG通路分析得到图一和图二的结果。图2D是在Cytoscape中用MCODE插件对STRING中获得的蛋白质相互作用网路做富集分析。

图1.第一种方法选出的62个特征基因

图2.第二种方法选出的16个特征基因

2.用S1PR1特征基因预测败血症患者的预后

图3E图4E是分别做探索集中存活者和非存活者,其结果1中得到的两种S1PR1特征基因的表达量热图,可以看到两类型样本在特征基因的表达量上有很大差异。

而图3.4中的生存曲线则是根据样本在特征基因总表达量上的中位值将样本分为高低表达组后进行生存分析。两类S1PR1特征基因都有显著的预后价值。低表达组有更差的预后水平。

图3.62个特征基因的预后分析

图4. 16个特征基因的预后分析

3.构建风险得分公式并评估效果

作者在用生存分析确定S1PR1特征基因有预后价值后,下一步构建风险得分公式,如下,作者通过对各组样本特征基因的表达量做z分数标准化,风险得分就是各特征基因z分数的线性加和,权重仅考虑该基因和S1PR1表达量上的相关性,即正相关Wi就取1,负相关Wi就取-1。(用Cox回归分析会不会更好呢?)

风险得分计算公式

        根据两类特征基因的风险得分公式分别计算样本的风险得分后,在探索集和验证集中观察两类样本在风险得分上的差异(图5A.图6A)。之后用ROC(受试者功能曲线)法去检验两类风险得分在探索集和验证集中对败血症患者预后的区分能力(图5B.图6B)。

图C做的是从全部基因组中抽出相同数量的特征基因(10000次),用相同方法去构建风险得分公式并用ROC曲线法去检验其能力,通过核密度图去和前文得到的两类特征基因的分类能力做比较,相当于做了置换检验。从图中可以看出作者两类特征基因的分类能力确实要比随机产生的特征基因的预测能力好。意义在于检验是否存在随机的特征基因会有更好的预测能力(David Venet et al 2011年的一篇文章中提到过此方法)。

图5.62个特征基因的分类能力

图6.16个特征基因的分类能力

        最后作者还用PCA法去检验两类特征基因在探索集和验证集中的分类能力。作者选了三个维度,可以看到两类特征基因在探索集中的分类能力较好,但在验证集中仍存在一些非存活样本和存活样本混合的情况。

图7. 62个特征基因的分类能力PCA

图8.16个特征基因的分类能力PCA

小结

        那么今天的文献分享到这里就结束了,本文所作的工作并不多,无非是选了两个带有预后信息的败血症样本的芯片数据集,通过两种方法找到已知预后标志基因S1PR1的相关基因与差异分析得到的败血症患者预后相关基因取交集,通过线性加权做风险得分,最后直观比较两组在风险得分的差异,ROC法,PCA法检验分类能力。中间还有必须的对基因的功能富集分析,表达量热图等。文章通过生信手段对非肿瘤疾病预后的分析步骤清晰,适合我们学习。

©著作权归作者所有,转载或内容合作请联系作者
禁止转载,如需转载请通过简信或评论联系作者。
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,496评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,407评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,632评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,180评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,198评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,165评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,052评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,910评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,324评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,542评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,711评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,424评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,017评论 3 326
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,668评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,823评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,722评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,611评论 2 353