很多时候,我们一直想做到出色,做到出彩,但是比我们优秀的人,却在相同的方向上,做了十年,出彩了十年,而且他们没有停下脚步~~
写在前面
Emmm,GO注释常常是一个有点争议的分析项目。一般有两种注释方法:
- 基于结构域,比如interproscan
- 基于序列比对
当然,两者是本质。实际上,现在绝大多数注释都是基于 idmapping,比如比对到 nr 或者到 uniprot ,然后做一轮 IDMAPPING。比对到nr,能转化成GO注释的,基本就uniprot。商业化软件 BLAST2GO 就是这么个操作。TBtools也是这么个操作。这些GO注释都要自己比对,自己动手,还是耗费一些本地资源。很久很久以前,有看到这么一个在线工具Pannzer2。
最近终于还是找到时间看了下。感觉还不错
那我为啥觉得 Pannzer2 还不错?
- 他们专门搞了序列比对,用于注释,见文章《SANSparallel: interactive homology search against Uniprot》
- 他就是用的uniprot,而不用nr,跟我一直推荐的一样
- 他做了注释转移过程和注释转移后的语义过滤
当然,更多细节,感兴趣的朋友应该直接去看他的paper,见文章《PANNZER2: a rapid functional annotation web server》
使用简单
- 打开网站
http://ekhidna2.biocenter.helsinki.fi/sanspanz/
选择Annotate
即可进入注释提交页面
注意到,要求是一个文件不能超过
10Mb
。一般大概就是2w个蛋白序列。超过这个数目,可以直接用 TBtools 进行序列文件分隔。如此,可以得到适合与提交到网站的注释信息文件,提交即可。
如此,等到即可
。
大体上花了 接近 2 个小时,也就是一个小时 1w+ 序列,感觉还不错。对于香蕉大概是3w+个基因。分别提交一个任务,是不是时间也不变? 这个我没测试。
但是速度已经可以了。完成后收到邮件如下,
打开对应链接,就可以查看结果
OK,
软件就介绍到这里。希望大伙不要一下子把对方的服务器跑崩溃了。
不要跟 Batch SMART 一样。。。
写在最后
网络服务好的时候,是真好,不好的时候,是真不好。不维护了呢?宕机了呢?倒闭了呢?一切都是绑定与被绑定。
不过,能解决眼前问题,不就行了嘛?不然呢?