后来发现,即便努力实现了各科代表物种的注释,但在某些情况下还是直接注释可能更方便些。于是对GFAP添加了一个新的模块,该模块直接用pfam, GO, KEGG官网数据进行注释。但有两个小问题:一个是注释过程相对慢;二是这些功能只能用蛋白序列去实现。同学们可以根据自身情况灵活选择。注意,当使用的库是总库(即没有标注plant)时,是可以对除植物外的其他物种注释的。功能使用方法如下:
一共有三个数据库需要去我分享的账号进行下载,它们分别是植物专用pfam数据库,总的pfam文件(适用各物种)以及总的kegg文件(适用各物种)。点击①,②和⑦可自动链接到下载账号~
下载完成后,只需要将下载的数据库放到GFAP的文件夹下就可以进行使用了。例如:
这个操作再简单点儿说就是GFAP.exe在哪儿就放哪儿。
pfam和GO ID的生成:
完成上述操作后,需要告诉软件你放的是哪个数据库,点选之后(③),把蛋白序列文件放入规定位置(④),然后保存命名(⑤),点击⑥即可运行功能。kegg IDs的运行过程类似。
完成后,pfam的结果会直接给出功能。但GO和KEGG只会给出ID,接下来的操作就是到前面的模块该做什么做什么就好,例如: