视频来自Y叔讲解。
clusterProfiler 4.0 整合多组学的富集工具。
功能富集分析
将几百个差异基因转为几个生物学过程,利于进行后续试验验证。
分析方法
ORA,FCS进行打分(GSEA, 通路上下调), PT(拓扑结构, 不普遍)
ORA
将所有能测到的基因(或全基因组)作为背景,超几何分布
GSEA
不筛选差异基因,去查看通路的基因方向,是上调还是下调。Gene set S 是对通路激活还是抑制。
软件不更新,会有问题:
如David
clusterProfiler
GO 富集分析
GO terms 结构网路图,需要去冗余。GOsemsim,根据词义取出具有代表性的。
KEGG
需要看这些KEGG的基因组成具有重复。右图选取独立和重复的分布查看
基因组坐标的通路分析
现在也查看micoRNA等非编码的RNA。 使用了CHIPseeker. 对于缺少注释的位点,利用CHIPseeker,找到附近的基因的功能,查看是否此非编码位点也发挥类似的作用。
比较多组学
使用formula实现。利用多个时间点和分组一起分析。
加入tidy接口
使用mutate整理数据,可以使用ggplot画自己的图
GSEA的处理:
功能分析全家桶
文档
公众号,富集分析无处不在
KEGG与GO分析是一个非常好的手段。
FUMA对SNP位点(GWAS得到)的富集分析。把SNP映射到附近的基因上, 对这些基因进行富集。
后续开发
microbiomeProfiler
找出输出某个term的基因
eg: ego[["GO:022222"]]
bitr['8318', 'ENTREZID', 'GO', 'org.Hs.eg.be']
查看通用模式
得到一个可靠的注释(或者跑软件预测): 两列(GO term, 注释信息)
使用通用功能: GOMAP, 或GSEA