构建系统发育树主要有四种方法:ML、NJ、MP和BI。
与ML和NJ相比,BI的方法效率更高,已有的研究结果显示,对于同一组数据的分析, 贝叶斯方法分析结果中的节点支持率高于其它算法中的相应结果。最大似然法(ML)被选择时候后最多,但是计算比较慢,如果序列属于远缘,选ML比较好;相比较而言NJ计算过程比较快。
一般系统发育分析都需要做两个及其以上的方法计算。这里简单记录一下 如何用BI构建系统发育树。
1. 多序列比对(我一般选择MEGA-clustw)
2. 保守区检测(Gblock 0.91b_)
http://molevol.cmima.csic.es/castresana/Gblocks_server.html ( 如果用的时候总是导不进去,可以直接以Fasta格式粘贴进去。这个运行时间有点久,不知道是不是电脑的原因)
3. 饱和度检测(DAMBE)如果序列饱和就不能建树,如果不饱和符合建树条件。
运行完结果后检查ISS<ISS.C,且p<0.05 说明不饱和可以建树。
DAMBE的使用方法:http://blog.sciencenet.cn/blog-508298-716082.html 可以完全按照这个来,导入文件的时候最好选择FASTA格式的文件。
4. 核苷酸替代模型的选择 【这一步很重要,再这个上面我花费了不少的时间。】
这里我用是 MrMTgui 。需要加载的其他插件还有PAUP、Modeltest(48种)和MrModeltest (24种)。PAUP 文件格式是NEX,可以用mega导出这种格式的文件。
打开 MrMTgui软件后,再下方path的位置选择各个插件的位置。比如PAUP 的console.exe文件,其他的插件也是这样。
如果全都设置好以后,选择 RUA-PAUP, 选怎nex格式文件(有时候找不到文件,别忘了把文件类型改为ALL*)
会出现以下界面,这是在计算score文件,不要着急。计算完成后会提示是否运行下一步,选择否,点击Save Scores。文件名保存为 mrmodel.scores 文件【scores文件即可】。
点击select files ,选择刚刚保存的.score 文件。点击MrModeltest 就开始运行了。结果有两部分文件hLRTs和AIC,下滑到AIC部分,然后 找到贝叶斯部分,这个时候就已经得到了最好的模型。将从begin到end这部分程序,复制保存。
到这里做完了前期所有的工作,开始了真正的进行BI分析。MrBays 准备好,这是不需要安装的软件,直接打开其.exe文件,可以直接使用。将已原来已经复制的几行执行程序粘贴到你的序列文件种,http://www.360doc.com/content/17/1002/18/45962007_691819677.shtml 【连接包括参数的各种意义。】
BEGIN mrbayes;
lset nst=6 rates=propinv Code=Metmt(如果程序是线粒体);
Prset statefreqpr=dirichlet(1,1,1,1);
mcmc ngen=300000(代) printfreq=1000 samplefreq=100;
sump;
sumt;
END;
设置好各项参数之后,就可以打开软件,输入exe 文件名.nex 运行了。
最后可以用figtree打开 文件名.nex.con.tre 文件,编辑树。
ps:贝叶斯的nex和paup要求的有点不一样可以用,ALTER http://www.sing-group.org/ALTER/ 转换格式
相关参考资料:
冯思玲. 系统发育树构建方法研究[J]. 信息技术, 2009(06):45-47+51.
https://www.docin.com/p-945498009-f2.html (高芳銮老师写的十分详细)
Ending~