GAFP的所有注释信息是基于蛋白结构域而来。superHMM模块它的主要作用是检测输入序列其完整蛋白序列中所含有的功能域的。界面分布如下:
如上图所示,已经将操作尽可能进行了简化,同学们时间如此宝贵何必还要放一部分在学习复杂操作的软件呢?包括GAFP包括SPDE,我所做软件的特点是只要你认真读界面提示就可以完成操作。在第一部分功能域查询时记住选择与之前比对时所用物种相同即可,如果这里物种忘记选择,最后的结果是大面积的无功能注释(this ID was not annotated...)。有个框可以放入物种拉丁学名指的是当用户所需要的物种是网上数据库下载时,需要手动在这里输入所下载文件名字中包含的物种学名,过程是:从数据库下载数据,放入指定位置,在软件数据拉丁学名,然后查询就好。第二部分的按钮是用于显示用户电脑数据库中所含有的物种的,点击即可出现名字且内容可复制便于用户输入拉丁学名等类似操作。就在今天,我发现同学们有用一个物种全部蛋白序列进行注释的,这样的话,会得到一个相对大的文件,这个大文件同学们处理起来可能不是很方面,因为一般的windows软件很难打开它。同学们在作分析的时候一般只是用到其中一部分信息。所以,为了解决所需要信息的提取问题,开发了下面的功能:
用法很简单,还是那句话根据提示来。第一个框提示ID,那么这个框需要的文件就是你想要提取的基因的ID,第二个框是注释文件,这个就是经过你注释的文件,然后再就是保存。之后,提取就好,批量操作~