什么是基因本体论(GO)?
基因本体论(Gene Ontology,GO,http://www.geneontology.org/)是国际基因功能分类系统,旨在建立一套随着研究动态更新的可控词汇表来限定和描述各个物种的基因和蛋白质功能。该数据库将收录的基因本体按照术语描述的内容不同,将所有基因本体分为三大类:生物过程(Biological Process)、细胞组分(Cellular Component)、分子功能(Molecular Function)。GO的基本单位是term,每个term对应一个功能类别或细胞定位,一个基因可能对应一个或多个term。
GOplot的GO circle可视化
GO分析是几乎所有转录组相关论文中必有的一部分,其展示结果也多种多样。其中GOplot R包的可视化因形式美观、信息量大而颇受人们的喜爱。如图所示。
该图使用圆形形式展示富集结果,左侧:外圈是名字,中圈为差异情况(up和down),内圈为z-score(不是常规的统计z-score,仅给一个term是更可能降低(负值)或升高(正值)的暗示,计算方法:(up基因数-down基因数)/sqrt(基因数))。右侧:GO ID对应的term名字。
对GOplot的GO circle图有了初步了解后,我们就可以用微生信云平台在线绘制出图了。
1.打开绘图页面
http://www.bioinformatics.com.cn/plot_basic_GOplot_circle_plot_144
2.下载示例数据
输入数据包括两部分
(1)GO的富集结果,包括5列,分别为:分类,GOID,GO term名字,基因和p值(或者p.adj等),必需保持5列内容。
(2)富集结果基因及其对应的logfc。可以使用微生信工具:
根据某列索引从原始数据中提取感兴趣行从总表中提取
3. 拷贝并粘贴示例数据
注意,需将富集数据粘贴到富集结果数据框,基因log2fc数据粘贴到基因log2倍数变化数据框,数据保持必需一致。
4.修改参数,并提交
图片大小颜色以及标注字体大小等都可以个性化定制,可满足不同的绘图需求。
5.提交出图
6.其他注意点
第一列名字无所谓,但是第二列必需是GO:开头的
logFC和z-score的位置会根据数据及颜色自动左右调换
文字截断(可以通过调整图片宽度避免),修改字体、调整字体大小等,请使用inkscape软件进行操作
将GO:后边的数值换成kegg pathway id(或者任意其他有意义的ID),就可以绘制pathway的结果,后续用inkscape改下名字即可(编辑pdf,或者svg转pdf后再编辑)
没有预览就是没有出图,这时请参考示例数据,检查输入数据格式!
基本可以满足90%的需求。
微生信云平台 注册用户40000 引用415
微生信云平台(http://www.bioinformatics.com.cn)以160多款在线作图、在线数据分析工具为基本方式,致力于0代码分析数据,0代码展示数据结果,帮助生命科学、医学等领域的40000多名科研工作者更便捷地分析数据,了解数据,挖掘数据背后的生物医学意义,助力发高分文章,促进知识传播。