单细胞-KEGG/GO富集分析

前提:基于cluster的差异基因
原理:超几何检验,找出与整个基因组背景相比,在显著性差异表达基因中显著富集的GO、KEGG条目
(p<0.05:一般说明这个条目是有差异的)

输入文件:
mus_musculus/ :通过GeneID映射相应的功能注释
kegg.txt : 关注level 1、level2水平
go.txt :一般关注level2 水平下的 MF,BP,CC
markergene_list.csv :差异基因集

条形图:直观反应每个条目的基因数量

ggplot(data=df) + geom_bar(aes(x=gene, y=term, fill=level*)...)
GO barplot

KEGG barplot

气泡图:条目的富集程度
核心函数:enricher(R包:clusterProfiler)

enricher(diff_genes, TERM2GENE=unique(anno_all_df[c('pathway','gene')]), TERM2NAME=unique(anno_all_df[c('pathway','description')]), pvalueCutoff = 1, pAdjustMethod = "BH", qvalueCutoff = 1, minGSSize = 0, maxGSSize = 1000)
enrichment plot

注:上述资料是个人学习笔记,未补充细节部分。如果感兴趣 欢迎评论。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容