写在前面
此前我们在生信基地举办了生信基地第一课| 1.5天学会单细胞分析的交流活动,经过1.5d的学习,我们布置了如下文献结果复现作业,代码复现可见《NC》代码复现| scRNA-seq揭示人纤维化皮肤病中的成纤维细胞异质性和间充质成纤维细胞增加:
文章标题:Single-cell RNA-seq reveals fibroblast heterogeneity and increased mesenchymal fibroblasts in human fibrotic skin diseases
文章中文标题:单细胞 RNA-seq 揭示了人纤维化皮肤病中的成纤维细胞异质性和间充质成纤维细胞增加
文章链接:https://www.nature.com/articles/s41467-021-24110-y
发表期刊:《Nature Communications》
1、如下图的展示 进行大群聚类注释(图b)、各细胞类型占比分布(图f)、各细胞类型高表达基因热图(图d)各细胞类型marker基因的featureplot图(图e)。
2、对成纤维细胞亚群进行重新聚类(图a)、每个样本的细胞亚型的数量占比(图c)、展示每个样本的umap降维图(图b)、做下列图中基因的小提琴图(图g)(小提琴可分开展示)。
3、 高级分析细胞通讯 展示不同分组的各细胞类型的细胞通讯数量热图;
复现结果
学完了1.5d的课程后,这位同学已经可以输出以下内容啦,其实很多复现的内容相差无几,甚至图片要比原文更加美观~
复现流程:
1. 导入数据,初始化
2. 参数过滤
过滤基因:min.cells =3 过滤基因。
过滤细胞:umi.range = 200~35000,feature.range = 100~6500, 线粒体相关基因:Mitorelatedgenes基因集(17) ,使用MAD方法进行过滤。
过滤后数据如下:
对NF1的count重新过滤(503~ 25973):
3. 整合数据
使用vst方法寻找高变基因(数目2000),整合方法采用Harmony。
4. 聚类 以三种阈值对数据进行测试,最终得出分辨率:0.5,PCA维数15符合原文章。
5. 注释 Marker Gene (原文获取总结)
分群图:
详细featureplot:
ENDO: 1.5.6群定义为ENDO, 分别为ENDO_1, ENDO_2, ENDO_3。
FIB: 0.4.7.15 群定义为 FIB,分别为FIB_1, FIB_2, FIB_3, FIB_4。
SMC: 2.12群定义为SMC,分别为SMC_1, SMC_2。
KRT: 3.8.13.18.19 群定义为KRT,分别为KRT_1, KRT_2, KRT_3, KRT_4。
IMM:9群定义为IMM。
LYME:11群定义为LYME。