废话系列
来自于《GO富集结果整体可视化》
GO (Gene Ontology )是一个基因功能的国际标准分类体系。意在从分子功能 (Molecular Function)、生物过程 (Biological Process)、和细胞组成 (Cellular Component) 三个层面对基因和蛋白质功能进行限定和描述,建立一个适用于各种物种并能随着研究不断深入而更新的语言词汇标准。
GO富集分析已经算是很常规的分析内容,可以很方便地将分析得到的基因集归类到不同的GO条目,从而让研究者可以轻松地得知这些基因都参与哪些生物过程。GO分析的操作这里就不再赘述了,网上有很多相关的帖子,基本上常规的物种用clusterProfiler包就可以解决了。今天我想来谈谈如何可视化GO分析的结果。对于GO富集结果的可视化,最常见的就是用条形图和气泡图来展示部分关注的条目。
上面两种展现形式最为常见,可以很好地展示关注的条目。我们都知道有时候GO富集的条目会很多,如果想整体预览一下,有没有什么方法可以展示所有条目都涉及哪些功能呢?答案是肯定的。下面就来介绍一下simplifyEnrichment包是如何展示GO富集结果的。这里用该包中数据做一个演示。
代码
>library(simplifyEnrichment)
>go_id = random_GO(500)
> head(go_id)
[1] "GO:0070233" "GO:0007213" "GO:0061445" "GO:2000597" "GO:0010650"
[6] "GO:0055090"
>mat = GO_similarity(go_id,ont='BP')
>simplifyGO(mat)
结果如下图:
结果看起来还是有点高大上的感觉,从图中可以看出496个GO条目根据条目名称的语意相似性被分成9个大类,每个大类右边有注释条,标明了每个类中涉及的条目关键字,有点类似词云的感觉。
结束语
该包使用起来很简单,虽然不能准确的展示每个GO条目,但可以从整体上概览GO条目都涉及哪些方面,对于后续筛选还是很有帮助的。该包还有更为细节的用法,这里就不再赘述了,感兴趣的可以自己去摸索。按照惯例最后附上官方说明链接:Simplify Functional Enrichment Results 和 Word Cloud Annotation。