文献阅读2: Proteomic and Metabolomic Characterization of COVID-19 Patient Sera

1. 样本组成

99份病毒灭活处理的血清样本:分为对照(健康)组、疑似但实为普通流感组、新冠感染轻症组、新冠感染重症组。


临床信息表-1

临床信息表-2

2. 样本处理过程

  • 5 μL serum 溶解在 50 μL lysis buffer (8 M urea in 100 mM triethylammonium bicarbonate, TEAB) ;还原、烷基化、两步trypsin酶切、 TMTpro 16-plex标记;
  • 预分120个组分,最终合并为40个组分,Q Exactive HF-X DDA检测;
  • PD搜库: Homo sapiens fasta database downloaded from UniprotKB on 07 Jan 2020 and the SARS-CoV-2 virus fasta downloaded from NCBI (version NC_045512.2).
  • The peptide-spectrum-match allowed 1% target false discovery rate (FDR) (strict) and 5% target FDR (relaxed). Normalization was performed against the total peptide amount.
  • Quality control:The quality of proteomic data was ensured at multiple levels.
    a. First, a mouse liver digest was used for instrument performance evaluation.
    b. We also run water samples (buffer A) as blanks every 4 injections to avoid carry-over.
    c. Serum samples of four patient groups from both training and validation cohorts were randomly distributed in eight different batches.
    d. Six samples were injected in technical replicates.
  • non-target metabolomics 代谢组学分析:每个样本分成四份,进行四种检测:two for analysis using two separate reverse-phase /ultra-performance liquid chromatography (RP/UPLC)-MS/MS methods with positive ion-mode electrospray ionization (ESI), one for analysis using RP/ UPLC-MS/MS with negative-ion mode ESI, and one for analysis using hydrophilic interaction liquid chromatography (HILIC)/UPLC-MS/MS with negative-ion mode ESI.
  • 统计学分析
    a . 差异倍数选择:Log2 fold-change (log2 FC) was calculated on the mean of the same patient group for each pair of comparing
    groups. The statistical significantly changed proteins or metabolites were selected using the criteria of adjust p value less than 0.05 indicated and absolute log2 FC larger than 0.25.
    b. t-test:Two-sided unpaired Welch’s t test was performed for each pair of comparing groups and adjusted p values were calculated using Benjamini & Hochberg correction.
    c. 机器学习:From the training cohort, the important features were selected with mean decrease accuracy larger than 3 using random forest containing a thousand trees using R package randomForest (version 4.6.14) random forest analysis with 10-fold cross validation as binary classification of paired severe and non-severe group using combined differentially regulated proteins and metabolites features. The random forest analysis was further performed for a hundred times on the matrix with only the selected important features using normalized additive predicting probability as the final predicting probability and the larger probability as the predictive label. Those selected important features were used for the random forest analysis on the independent validation cohort.

3. Results

为了有效地对单细胞测序数据进行各种处理分析,特别是细胞亚型的鉴定,通常需要首先对单细胞测序数据进行降维。单细胞测序数据的降维方法主要可分为两大类:
1、Dimensionality reduction(降维),降维方法通常是把高维数据通过优化保留原始数据中的关键特征后投射到低维空间,从而可以通过二维或三维的形式把数据展示出来。
常用的降维方法有:
1)PCA(Principle Component Analysis),主成分分析,是一种线性的降维方法;
2)t-SNE(T-distributed stochastic neighbor embedding),是一种非线性的降维方法;
3)UMAP (uniform manifold approximation and projection) (Becht et al., 2018, Nat. Biotechnol.),
4)scvis (Ding et al., 2018, Nat. Commun.)
2、Feature selection(特征选择),主要是通过去除信息含量少的基因而保留信息含量最多的基因来降低数据的维度。
常用的Feature selection的方法有:
1)基于先验信息的方法(如已知细胞的亚型)。比如通过SCDE软件鉴定已知不同细胞亚型间的差异表达基因,然后再基于差异表达基因来聚类分析等。
2)非监督方法。又可细分为:
(i) 基于highly variable genes (HVG) ;
(ii) 基于spike-in,如scLVM (Buettner et al., 2015)和BASiCS (Vallejos et al., 2015)等;
(iii)基于 dropout,如M3Drop (Andrews and Hemberg, 2018)。
参考:https://www.cnblogs.com/aipufu/articles/11470334.html

  • Part 1. Proteomic and metabolomic profiling of COVID-19 sera
    蛋白质组共鉴定到894个蛋白和941个代谢物,查看QC样本CV,及UMAP降维后样本分布情况。
    Figure S1
  • Part 2. Identification of severe patients using machine learning
    选取部分数据蛋白质组及代谢组数据作为训练集进行随机森林机器学习来区分重症新冠患者,找到29个重要的变量,包括22个蛋白和7个代谢物。用建立好的模型对另外10个做验证。
    机器学习样本分配
    机器学习的结果和模型评估结果
  • Part 3. Proteomic and metabolomic changes in severe COVID-19 sera
    新冠患者与非新冠患者共105个差异蛋白和373个差异代谢物,其中有93个蛋白和204个代谢物与新冠的严重程度相关;93个差异蛋白主要富集在activation of the complement system, macrophage function and platelet degranulation三条信号通路中,包括50个蛋白;相应的,代谢物中82个在上述三条信号通路中。文章剩余部分便是对这三条信号通路进行具体阐述了,不再一一介绍。
    Differentially expressed proteins in different patient groups in the training cohort.

    Differentially expressed metabolites in different patient groups in the training cohort.

    Proteins and metabolites regulated in COVID-19 patients but not in non-COVID-19 patients.

    Dysregulated proteins in COVID-19 sera.

    Dysregulated metabolites in COVID-19 sera.

    Key proteins and metabolites characterized in severe COVID-19 patients in a working model.

    Identification of specific clusters of proteins and metabolites in COVID-19 patients. 791 proteins (A) and 941 metabolites (B) were clustered using mFuzz into 16 significant discrete clusters, respectively.

4. 后记

整篇文章的分析并不复杂,整体思路:QC(数据可信)➡️ 机器学习区分患者与正常人(分组)➡️ 差异蛋白or代谢物,尤其是与疾病严重程度相关的差异蛋白。(差异分子)➡️pathway 分析,阐述疾病的主要病理特征。
从蛋白质组学的数据来看,这文章选取的差异倍数并不是很大,log(fold change)=1/4(可能是考虑到16标的压缩效应,我的10标都选的是1.2倍),最好有另外一种技术进行验证才更有说服力;机器学习的样本数较少。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,744评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,505评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,105评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,242评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,269评论 6 389
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,215评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,096评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,939评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,354评论 1 311
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,573评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,745评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,448评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,048评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,683评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,838评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,776评论 2 369
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,652评论 2 354

推荐阅读更多精彩内容

  • pyspark.sql模块 模块上下文 Spark SQL和DataFrames的重要类: pyspark.sql...
    mpro阅读 9,451评论 0 13
  • 今天是小春的婚礼,我下午赶到吃晚饭。给红包给小春,他说不要,同学都不说红包。我很惊讶,少有人能做到这一点的。他说,...
    静梦辰光阅读 200评论 0 0
  • 伤心难过时, 有人安慰你,这就是幸福! 身处困境中, 有人帮助你,这就是幸福! 生病难受时, 有人照顾你,这就是幸...
    轻舟ling阅读 278评论 0 5
  • 每一个孩子就是一本经书,是为母者终身奉读的经。这本经书好不好读,就看母亲的耐心、爱心、运气及造化了。——《亲爱的安...
    糖糖罗阅读 65评论 0 0
  • 在讲解牛股前咱们先回顾一下今天的盘面情况 今日早盘沪深两市小幅低开之后,沪深两市开盘后维持了近一小时的窄幅整理,在...
    财涛说阅读 199评论 0 0