说起KEGG的富集,马上脑海中就浮现了Y叔的R包-ClusterProfiler。当时身为生信小白的我并不是很清楚这个包是用来干什么的,用在什么数据上只知道这个包可以富集KO号然后转换成对应的代谢模块。当我拿着基因组KEGG注释下来的一堆KO号数据准备去富集的时候,看了clusterProfiler的教程,心想我的测序注释数据哪有什么p-value啊之类的数据还有差异的数据❓网上很多关于clusterProfiler的富集教程,但就是不说到底用在什么数据上。经文献查阅,最后才明白这个clusterProfiler包并不适用于我的二代原核基因组测序数据(草图或者全图),在此记录一下,以免以后某日又忘记,也其他小白同志们参考一下。
clusterProfiler的使用场景
- RNA-seq的数据
- chi-seq的数据
- 单细胞测序数据
- 蛋白质组数据
总结一下就是,
细菌
的二代测序草图KEGG
注释数据并不能使用clusterProfiler的包进行KEGG的富集,clusterProfiler主要是处理基因组水平以上的数据(就是不处理单菌二代三代测序的数据),转录组(转录水平)或者蛋白质组(翻译水平),
。
参考
clusterProfiler官方教程
clusterProfiler论文
PS:预告一下未来还有原核基因组个性化分析的日志,已经在写了,各位看官走过路过别错过关注一下吧
看官们不点个赞👍再走吗?