GO富集分析、KEGG富集分析和GSEA的区别 - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/481189718
GO是基因本体联合会所建立的数据库,旨在建立一个适用于各种物种的,对基因和蛋白质功能进行限定和描述的,并能随着研究不断深入而更新的语义词汇标准。GO 提供了一系列的语义用于描述基因功能的概念/类,以及这些概念之间的关系。GO (Gene ontology)是功能注释,即每个基因可能参与哪些pathway terms 或者 GO terms,没有阀值。
1 分别从细胞组分(cellular component, CC)、分子功能(molecular function, MF)、生物过程(biological process, BP)对基因产物进行了标准化描述;
2 对基因产物进行简单注释,通过GO富集分析可以粗略了解差异基因富集在哪些生物学功能、途径或者细胞定位。
KEGG(京都基因与基因组百科全书)是了解高级功能和生物系统,从分子水平信息,尤其是大型分子数据集生成的基因组测序和其他高通量实验技术的实用程序数据库资源,是国际最常用的生物信息数据库之一,以“理解生物系统的高级功能和实用程序资源库”著称。KEGG是功能富集,即基因集(多个基因)可能显著的集中在哪些功能上面,也可以说是在哪些通路上的富集。类似的通路数据库有wikipathway,reactome等。
GSEA:基因集富集分析,用于确定先验基因集是否在两种生物状态(例如表型)之间差异显著。
区别:
GO/KEGG差异基因的一刀切法——仅关注少数几个显著上调或下调的基因,容易遗漏部分差异表达不显著却有重要生物学意义的基因,忽略一些基因的生物特性、基因调控网络之间的关系及基因功能和意义等有价值的信息
GSEA不需要指定明确的差异基因阈值,算法根据实际整体趋势分析。