前提:基于cluster的差异基因
原理:超几何检验,找出与整个基因组背景相比,在显著性差异表达基因中显著富集的GO、KEGG条目
(p<0.05:一般说明这个条目是有差异的)
输入文件:
mus_musculus/ :通过GeneID映射相应的功能注释
kegg.txt : 关注level 1、level2水平
go.txt :一般关注level2 水平下的 MF,BP,CC
markergene_list.csv :差异基因集
条形图:直观反应每个条目的基因数量
ggplot(data=df) + geom_bar(aes(x=gene, y=term, fill=level*)...)
GO barplot
KEGG barplot
气泡图:条目的富集程度
核心函数:enricher(R包:clusterProfiler)
enricher(diff_genes, TERM2GENE=unique(anno_all_df[c('pathway','gene')]), TERM2NAME=unique(anno_all_df[c('pathway','description')]), pvalueCutoff = 1, pAdjustMethod = "BH", qvalueCutoff = 1, minGSSize = 0, maxGSSize = 1000)
enrichment plot