原文bioRxiv preprint https://doi.org/10.1101/2020.02.20.957936.
Terms
1.Support Vector Machine (SVM),支持向量机
基本模型是在特征空间上找到最佳的分离超平面使得训练集上正负样本间隔最大,用来解决二分类问题的有监督学习算法,在引入了核方法之后SVM也可以用来解决非线性问题。参考[机器学习] 分类 --- Support Vector Machine (SVM)_人工智能_曾先森 --- 学习不止于抵达,而在于远航-CSDN博客
2.ERCC,External RNA Controls Consortium
为Spike in标准化RNA而使用的内参定量,其他标准化方法参考RNA-seq中的那些统计学问题(二)FPKM/RPKM之外的那些标准化方法 - 简书
3.silhouette score,轮廓系数,一种聚类指标,取值-1~1,越大越相似
4.random forest,一种算法,随机取行列,避免过度拟合。
5.differential gene expression (DGE) analysis,表达谱分析
重视差异基因分析,没有转录组详细
框架
1.背景
HSC分化经典的hierarchical model已经逐渐被HSC compartment model取代,理由如下:(1)LMPP(mouse),MLP(human)早期就丧失了向Meg、Ery分化的能力;(2)小鼠确实存在MK-primed HSC且表达MK/PLT特征性的VWF和CD41;(3)形态学定义的HSC中可以找出MK-progenitor。这些互相包容交互的关系显然不支持具有明确层级关系的经典理论。
在compartment的理论下,从HSC到MK研究存在一定困难,(1)HSC和MK progenitor共享nich和转录因子,一般手段很难将二者区分开;(2)MK占骨髓MNC不到0.01%,体积大,细胞脆弱,很难取得样本;(3)体外培养的MK从形态学上就明显不同于体内的MK。
2.问题
(1)HSC里是否存在MK-primed HSC cluster
(2)不同染色体倍数的MK有什么不同
(3)stress对MK和HSC有什么影响
3.解答
(1)存在MK-primed HSC
取样:5 sternal BM sample,884 HSCs(CD34+CD38-CD45RA-CD90+CD49f+),index sorting
filter:support vector machine,ERCC spike-in
cluster:119 cells,5 cluster
其中,cluster 1和cluster 4于表达与PLT功能相关的基因
(增加证据:
取样:20 sternal BM sample,1106 single MKs and 188 pools of 20-100 MKs(CD41+CD42+)
filter:random forest,training group:20-MK pools,ERCC spike-in
projection:TOP 2000 genes 依然分布在与cluster 1、4相似的位置
)
trajectory:MK相关两群基本集中在point 2之后,用Novershter的资料映射,可以看出MK分布位置重叠,而MEP分布在cluster 1位置
function:转录组不同的cluster在cell surface maker intensity水平也可以分为不同cluster,结合Belluschi的index及细胞培养结果,本文中的cluster 1、4即Belluschi形成MK的HSC
(2)low ploidy(2N-4N)与high ploidy(8N-32N)
取样:10 sternal BM sample,1106 single MKs and 32 pools of 20-50 MKs(不懂为什么这里要再取新的MK pools并且较前188少那么多)
GO:
1)low poidy:PLT function
上调degranulation,coagulation,hemostasis,would healing
2)high ploidy:PLT release
下调translational initiation,elongation and termination,protein localization and cellular protein complex disassembly
且high ploidy下调的基因可以映射到cluster 1,再次说明HSC确实存在MK-primed cell,point 2之后的基因下调使得细胞向成熟分化。
目前的基于体外培养MK的认知是coagulation和hemostasis在染色体倍数多的MK(2N-16N)上调,但是这篇文章从fresh human BM sample的结论看并非如此。
电镜:
1)low ploidy:血小板特异性颗粒,线粒体,smooth ER,核糖体
2)high ploidy:血小板特异性颗粒,线粒体,rough ER,smaller nucleoi,heterochromatin
作者认为电镜结果符合转录组的结论,对于high ploidy的血小板特异性颗粒,用了formed这个形容词,可能是认为这些与coagulation相关的颗粒都在high ploidy前形成了,如果把high ploidy分为更多组来看,8N,16N,32N血小板相关颗粒数目都没有再变化可能更能说服我这是formed颗粒;smooth/rough ER这里应该是针对下调cellular protein complex disassembly,一直以为smooth ER合成激素类物质,可能是smooth→rough蛋白合成增加,disassembly下降,但是感觉这俩并没有多大联系,合成增加就一定降解减少吗?不得告诉我原来有多少,现在剩多少,怎么拆解的吗?荧光标记特定得蛋白去在高内涵harmony看蛋白的动态变化会不会更直观?对于下调translational initiation只能赞同heterochromatin,核仁缩小或消失一般不是分裂的标志?难道意思是准备复制分裂的时候转录水平下降?
(电镜这部分感觉有点牵强,我好累。)
Annotation:
将随ploidy增加而上调的基因通过Ensemble注释,发现于跨膜蛋白相关的基因较多,明显不同于in vitro MK,推测这些跨膜蛋白在in vivo MK起到胞外信号传递的作用。
(3)不同的Stress及PLT环境下MK是明显不同的两个分化状态
取样:CAD或MI患者7人,101 pools;瓣膜置换术患者8人,55 pools。
DGE analysis:上调的基因大多与PLT激活和α颗粒增多有关,且map到cluster 1上。
小结
本文定义了人in vivo MK的转录图谱,进一步确证HSC中有MK-primed HSC(cluster 1 和cluster 4),HSC中如此高比例的MK-primed HSC也符合“MK在HSC compartment中首先分化”的假说。同时,通过对比不同染色体倍数的MK,说明MK 通过ploidy胞内分裂切换自己的两种状态。
cluster 1和HSC功能、MK生成、MEP克隆形成等相关,cluster 4和血小板功能更加相关(但是为什么MI患者上调的基因map到cluster 1?说明stress和PLT的影响涉及到HSC?)cluster1 在MK-priming HSC和早期MK发育中有重要作用,对于cluster 4的说明尚有欠缺。