目的:通过GO富集分析,可以将差异表的的基因按照其功能进行归类,达到对基因进行注释和分类的目的。
富集的原理:enrich_factor-----( 某个term中出现的差异基因的个数/所有的差异基因的个数 ) / (term中包含的所有基因 / 数据库中总的基因数目)
理解:(作者:高泮优)基于我们的先验知识(基因组注释信息),将基因富集,可以想象成,用一堆代表基因功能的箱子(bin)把具有相同或相似功能的基因装起来,起到了降维的作用,当然,每个基因可能同时参与好几种功能,这种cross-talk我这里就不说了。这样,得到这两组数据后,我们所分析的不是单个基因表达的差异,而是箱子与箱子之间的差异。比如我们发现,运动前后的主要差异集中在消化基因上面,那么我就有理由说,规律作息和适当运动让我消化变好、营养吸收充分进而智商提高(我编的,别信...)。由此,我们得到的数据更容易解释。GO分析好比是将基因分门别类放入一个个功能类群的篮子,而pathway则是将基因一个个具体放到代谢网络中的指定位置。
专属名词
GO term:(举例如下)