关于MAKER
MAKER是一款易于使用的基因组注释管道软件,在小型或大型科研项目都适于使用。MAKER既可用于对于新研究生物基因组进行de novo注释以为更新注释提供证据,也可以用于组合注释,证据和质控统计数据用于后续可视化软件(JBrowse, Chado, Apollo)分析。
关于基因组注释
1、什么是注释?
注释是指对基因组不同特征的描述,通常可分为基因组结构或功能的注释。
结构注释:包括基因外显子,内含子,UTRs,剪切形式等;
功能注释:包括基因在生物体发生作用的过程和参与的生物通路(代谢,分子功能,表达区域等),这一注释可也称为GO注释。
一份好的注释数据必须满足以下两个条件:一是能够保有现有的注释信息,二是提供新的可能的注释。这一过程需要结合基因组注释的质控,管理,校正等过程。
通常来说,基因组结构注释的证据(Evidence)来自以下三种途径:
一是,从头基因预测
二是,转录RNA数据预测(RNA-Seq/ESTs/cDNA/transcript)
三是,同源蛋白预测
2、为什么基因注释如此重要
众所周知,基因组序列本身只是一堆字符的排列,本身并无用处。因此,研究者面临的第一个问题就是在这些序列中首先找出“基因”的位置。而要鉴别出基因,我们就要对基因组进行注释。虽然对大多数研究者而言,他们每天不会花太多时间研究注释本身,但在实际工作中却时刻离不开它。
不正确和不完整的基因组注释将会严重影响研究者的研究实验
正式使用MAKER
1、MAKER能做些什么
a.鉴别和屏蔽基因组重复序列
b.ESTs与基因组的比对
c.蛋白序列与基因组的比对
d.产生基因的从头预测证据
e.将所有证据整合为最后的注释
f.报告基于证据的质量数值并用于下游注释管理
2、MAKER的下载安装
下载地址:http://www.yandell-lab.org/software/maker.html,提交注册信息获取软件安装包。
安装:阅读README和INSTALL,按步骤进行安装。
3、MAKER的使用
正式安装完成以后,可通过maker -h查看使用方法。
简而言之,MAKER是通过 <maker_opts> <maker_bopts> <maker_exe>这三个控制文本对用户提交的程序进行运行。
4、MAKER的输出结果
首先查看dpp_contig_master_datastore_index.log 文件,检查在运行过程中是否有任何错误出现。
如果一切进展顺利,你可以在The contig-dpp-500-500.gff类似名称的文件中获得你想要的注释结果。
5、后续下游分析
Apollo
apollo有两种版本,一种是桌面应用,另外一种是网站应用。如果你只想要稍微了解一下你的注释,那么你可以选择桌面应用。
6、彩蛋
小声哔哔,其实MAKER已经有网页版了。对于那些对linux和命令行操作不熟悉或者嫌弃安装使用过于麻烦的用户,请往这边走:http://weatherby.genetics.utah.edu/cgi-bin/mwas/maker.cgi?rm=job_create
但是网页版对提交项目的规模也存在一定的限制,如果不影响你的使用的话,你就放心大胆的使用吧!