进化树的构建·再识——25.3.2018,需要重新进行跑流程/编辑

系统发育树的构建在大学学过并用来做毕设,可是感觉自己在进化树的构建上面仍有一些知识/技能模块的缺失,恰好导师请了一位做进化的好友专门过来给我讲解了进化树的构建,让我能补齐一些知识。

数据

序列根据需要可以选取不同类型(cds、dna、rna、protein...)和不同位置(基因家族的全长序列、基因家族某个结构域的序列、非编码序列...)。在序列选取过程中尽量排除具有诱导性的序列。实验过程所用的是一组病毒中某基因家族的cds序列。

>less -S gB.fas#共有80条。
例:
>AF257079
ATGCCCGCTGGTGGCGGTCTTTGGCGCGGGCCCCGCGGGCATCGGCCCGGGCACCACGGCGGTGCTGGCCTCGGACGTCTTTGGCCTGCTCCACACCACGCTGCAGCTGCGCGGGGCGCCGTCGCGCTAGCGCTGCTGCTGCTGGCGCTCGCCGCGACCCCGACGTGCGGCGCGGCGGCCGTGACGCGGGCCGCCTCGGCCTCGCCCGCGCCCGGGACGGGCGCCACCCCAGACGGCTTCTCCACGGAGGAGTCCCTCGAGGAGATCGACGGGGCCGTCTCCCCCGGCCCCTCGGACGCCCCCGACGGCGAGTACGGCGACCTGGACGCGCGCACGGCCGTGCGCGCGGCCGCGACCGAGCGGGACCGCTTCTACGTCTGCCCGCCGCCGTCCGGCTCCACGGTGGTGCGCCTGGAGCCCGAGCAGGCCTGCCCCGAGTACTCGCAGGGGCGCAACTTCACGGAGGGGATCGCCGTGCTCTTCAAGGAGAACATCGCCCCGCACAAGTTCAAGGCCCACATCTACTACAAGAACGTCATCGTCACGACCGTGTGGTCCGGGAGCACGTACGCGGCCATCACGAACCGCTTCACGGACCGCGTGCCCGTCCCCGTGCAGGAGATCACGGACGTGATCGACCGCCGCGGCAAGTGCGTCTCCAAGGCCGAGTACGTGCGCAACAACCACAAGGTGACCGCCTTCGACCGCGACGAGAACCCCGTCGAGGTGGACCTGCGCCCCTCGCGCCTGAACGCGCTCGGCACCCGCGGCTGGCACACCACCAACGACACCTACACCAAGATCGGCGCCGCGGGCTTCTACCACACGGGCACCTCCGTCAACTGCATCGTCGAGGAGGTGGAGGCGCGCTCCGTGTACCCCTACGACTCCTTCGCCCTGTCCACGGGGGACATCGTGTACATGTCCCCCTTCTACGGCCTGCGCGAGGGGGCCCACGGGGAGCACATCGGCTACGCGCCCGGGCGCTTCCAGCAGGTGGAGCACTACTACCCCATCGACCTGGACTCGCGCCTCCGCGCCTCCGAGAGCGTGACGCGCAACTTTCTGCGCACGCCGCACTTCACGGTGGCCTGGGACTGGGCCCCCAAGACGCGGCGCGTGTGCAGCCTGGCCAAGTGGCGCGAGGCCGAGGAGATGATCCGCGACGAGACGCGCGGCGGGTCCTTCCGCTTCACGTCGCGGGCCCTGGGCGCCTCCTTCGTCAGCGACGTCACGCAGCTCGACCTGCAGCGCGTGCACCTGGGCGACTGCGTCCTCCGCGAGGCCTCGGAGGCCATCGACGCCATCTACCGGCGGCGCTACAACAACACGCACGTGCTGGCCGGCGACAGGCCCGAGGTGTACCTCGCCCGCGGGGGCTTCGTGGTGGCCTTCCGCCCGCTGATCTCGAACGAGCTGGCGCAGCTGTACGCGCGCGAGCTCGAGCGCCTCGGCCTCGCCGGCGTCGTGGGCCCCGCGTCCCCCGCGGCCGCCCGTCGGGCCCGGCGCTCCCCCGGCCCGGCGGGGACGCCCGAGCCGCCGGCCGTCAACGGCACGGGGCACCTGCGCATCACCACGGGCTCGGCCGAGTTTGCGCGCCTGCAGTTCACCTACGACCACATCCAGGCGCACGTGAACGACATGCTGAGCCGCATCGCGGCCGCCTGGTGCGAGCTGCATAACAAGGACCGCACCCTGTGGGGCGAGATGTCGCGCCTGAACCCCAGCGCCGTGGCCACGGCCGCGCTGGGCCAGCGCGTCTCGGCGCGCATGCTCGGCGACGTGATGGCCATCTCGCGGTGCGTGGAGGTGCGCGGCGGCGTGTACGTGCAGAACTCCATGCGCGTGCCCGGCGAGCGCGGCACGTGCTACAGCCGCCCGCTGGTGACCTTCGAGCACAACGGCACGGGCGTGATCGAGGGCCAGCTCGGCGACGACAACGAGCTCCTCATCTCGCGCGACCTCATCGAGCCCTGCACCGGCAACCACCGGCGCTACTTTAAGCTGGGCGGCGGGTACGTGTACTACGAGGACTACAGCTACGTGCGCATGGTGGAGGTGCCCGAGACGATCAGCACGCGGGTGACCCTGAACCTGACGCTGCTCGAGGACCGCGAGTTCCTGCCCCTCGAGGTGTACACGCGCGAGGAGCTCGCCGACACGGGCCTCCTGGACTACAGCGAGATCCAGCGCCGCAACCAGCCGCACACGCTCAAGTTCTACGACATTGACCGCGTGGTCAAGGTGGACCACAACGTGGTGCTGCTGCGCGGCATCGCCAACTTCTTCCAGGGCCTCGGCGACGTGGGCGCCGCCGTCGGCAAGGTGGTCCTGGGCGCCACGGGGGCCGTGATCTCGGCCGTCGGCGGCATGGTGTCCTTCCTGTCCAACCCCTTCGGGGCGCTCGCCATCGGGCTGCTGGTGCTGGCCGGCCTGGTCGCGGCCTTCCTGGCCTACCGGCACATCTCGCGCCTGCGCCGCAACCCCATGAAGGCCCTGTACCCCGTCACGACGAAGGCGCTCAAGGAGGACGGCGTCGAAGAGGACGACGTGGACGAGGCCAAGCTGGACCAGGCCCGGGACATGATCCGGTACATGTCCATCGTGTCGGCCCTCGAGCAGCAGGAGCACAAGGCGCGCAAGAAGAACAGCGGGCCCGCGCTGCTGGCCAGCCGCGTCGGGGTGATGGCCACGCGCCGCCGGCACTACCAGCGCCTC
>GQ325658
ATGCCCGCTGGTGGCGGTCTTTGGCGCGGGCCCCGCGGGCATCGGCCCGGGCACCACGGCGGTGCTGGCCTCGGACGTCTTTGGCCTGCTCCACACCACGCTGCAGCTGCGCGGGGCGCCGTCGCGCTAGCGCTGCTGCTGCTGGCGCTCGCCGCGGCCCCGCCGTGCGGCGCGGCGGCCGTGACGCGGGCCGCCTCGGCCTCGCCGACGCCCGTCCCGGGCAGCCCCGGCCTCACCCCCAACGACGTCTCCGCGGAGGCGTCCCTCGAGGAGATCGAGGCGTTCACCCCCGGCCCCTCGGAGGCCCCCGACGGCGAGTACGGCGACCTGGACGCGCGCACGGCCGTGCGCGCGGCCGCGACCGAGCGGGACCGCTTCTACGTCTGCCCGCCGCCGTCCGGCTCCACGGTGGTGCGCCTGGAGCCCGAGCGGGCCTGCCCCGAGTACTCGCAGGGGCGCAACTTCACGGAGGGGATCGCCGTGCTCTTCAAGGAGAACATCGCCCCGCACAAGTTCAAGGCCCACATCTACTACAAGAACGTCATCGTCACGACCGTGTGGTCCGGGAGCACGTACGCGGCCATCACGAACCGCTTCACGGACCGCGTGCCCGTCCCCGTGCAGGAGATCACGGACGTGATCGACCGCCGCGGCAAGTGCGTCTCCAAGGCCGAGTACGTGCGCAACAACCACAAGGTGACCGCCTTCGACCGCGACGAGAACCCCGTCGAGGTGGACCTGCGCCCCTCGCGCCTGAACGCGCTCGGCACCCGCGGCTGGCACACCACCAACGACACCCACACCAAGATCGGCGCCGCGGGCTTCTACCACACGGGCACCTCCGTCAACTGCATCGTCGAGGAGGTGGAGGCGCGCTCCGTGTACCCCTACGACTCCTTCGCCCTGTCCACGGGGGACATTGTGTACATGTCCCCCTTCTACGGCCTGCGCGAGGGGGCCCACGGGGAGCACATCGGCTACGCGCCCGGGCGCTTCCAGCAGGTGGAGCACTACTACCCCATCGACCTGGACTCGCGCCTCCGCGCCTCCGAGAGCGTGACGCGCAACTTTCTGCGCACGCCGCACTTCACGGTGGCCTGGGACTGGGCCCCCAAGACGCGGCGCGTGTGCAGCCTGGCCAAGTGGCGCGAGGCCGAGGAGATGATCCGCGACGAGACGCGCGACGGGTCCTTCCGCTTCACGCCGCGGGCCCTGGGCGCCTCCTTCGTCAGCGACGTCACGCAGCTGGACCTGCAGCGCGTGCACCTGGGCGACTGCGTCCTCCGCGAGGCCTCGGAGGCCATCGACGCCATCTACCAGCGGCGCTACAACAACACGCACGTGCTGGCCGGCGACAGGCCCGAGGTGTACCTCGCCCGCGGGGGCTTCGTGGTGGCCTTCCGCCCGCTGATCTCGAACGAGCTGGCGCAGCTGTACGCGCGCGAGCTCGAGCGCCTCGGCCTCGCCGGCGTCGTGGGCCCCGCGTCCCCCGCGGCGGCCCGGCGGGCCCGGCGCGCCGCCGGGCAGGCGGGGACGCCCGAGCCGCCGGCCGTCAACGGCACGGGGCACCTGCGCATCACCACGGGCTCGGCGGAGTTTGCGCGCCTGCAGTTCACCTACGACCACATCCAGGCGCACGTGAACGACACGCTGGGCCGCATCGCGGCCGCCTGGTGCGAGCTGCAGAACAAGGACCGCACCCTGTGGAGCGAGATGTCGCGCCTGAACCCCAGCGCCGTGGCCACGGCCGCGCTCGGCCAGCGCGTCTNGGCGCGCATGCTNGGCGACGTGATGGCCATCTCGCGGTGCGTGGAGGTGCGCGGCGGCGTGTACGTGCAGAACTCCATGCGCGTGCCCGGCGAGCGCGGCACGTGCTACAGCCGCCCGCTGGTCACCTTCGAGCACAACGGCACGGGCGTGATCGAGGGCCAGCTCGGCGACGACAACGAGCTCCTCATCTCGCGCGACCTCATCGAGCCCTGCACCGGCAACCACCGGCGCTACTTTAAGCTGGGGAGCGGGTACGTGTACTACGAGGACTACAGCTACGTGCGCATGGTGGAGGTGCCCGAGACGATCAGCACGCGGGTGACCCTGAACCTGACGCTGCTGGAGGACCGCGAGTTCCTGCCCCTCGAGGTGTACACGCGCGAGGAGCTCGCCGACACGGGCCTCCTGGACTACAGCGAGATCCAGCGCCGCAACCAGCTGCACGCGCTCAAGTTCTACGACATCGACCGCGTGGTCAAGGTGGACCACAACGTGGTGCTGCTGCGCGGCATCGCCAACTTCTTCCAGGGCCTCGGCGACGTGGGCGCCGCCGTCGGCAAGGTGGTCCTGGGCGCCACGGGGGCCGTGATCTCGGCCGTCGGCGGCATGGTGTCCTTCCTGTCCAACCCCTTCGGGGCGCTCGCCATCGGGCTGCTGGTGCTGGCCGGCCTGGTCGCGGCCTTCCTGGCCTACCGGCACATCTCGCGCCTGCGTCGCAACCCCATGAAGGCCCTGTACCCCGTCACGACGAAGACGCTCAAGGAGGACGGCGTCGACGAGGGCGACGTGGACGAGGCCAAGCTGGACCAGGCCCGGGACATGATCCGGTACATGTCCATCGTGTCGGCCCTCGAGCAGCAGGAGCACAAGGCGCGCAAGAAGAACAGCGGGCCCGCGCTGCTGGCCAGCCGCGTCGGGGCGATGGCCACGCGCCGCCGGCACTACCAGCGCCTCGAGAGCGAGGACCCCGACGCCCTGTAG
>KF711983
GGCCCATCGGAGGCCCCCGACGGCGAGTACGGCGACCTGGACGCGCGCACGGCCGTGCGCGCGGCCGCGACCGAGCGGGACCGCTTCTACGTCTGCCCGCCGCCGTCCGGCTCCACGGTGGTGCGCCTGGAGCCCGAGCAGGCCTGCCCCGAGTACTCGCAGGGGCGCAACTTCACGGAGGGGATCGCCGTGCTCTTCAAGGAGAACATCGCCCCGCACAAGTTCAAGGCCCACATCTACTACAAGAACGTCATCGTCACGACCGTGTGGTCCGGGAGCACGTACGCGGCCATCACGAACCGCTTCACGGACCGCGTGCCCGTCCCCGTGCAGGAGATCACGGACGTGATCGACCGCCGCGGCAAGTGCGTCTCCAAGGCCGAGTACGTGCGCAACAACCACAAGGTGACCGCCTTCGACCGCGATGAGAACCCCGTCGAGGTGGACCTGCGCCCCTCGCGCCTGAACGCGCTCGGCACCCGCGGCTGGCACACCACCAACGACACCTACACCAAGATCGGCGCCGCGGGCTTCTACCACACGGGCACCTCCGTCAACTGCATCGTCGAGGAGGTGGAGGCGCGCTCCGTGTACCCCTACGACTCCTTCGCCCTGTCCACGGGGGACATCGTGTACATGTCCCCCTTCTACGGCCTGCGCGAGGGGGCCCACGGGGAGCACATCGGCTACGCGCCCGGGCGCTTCCAGCAGGTGGAGCACTACTACCCCATCGACCTGGACTCGCGCCTCCGCGCCTCCGAGAGCGTGACGCGCAACTTTCTGCGCACGCCGCACTTCACGGTGGCCTGGGACTGGGCCCCAAAGACGCGGCGCGTGTGCAGCCTGGCCAAGTGGCGCGAGGCCGAGGAGATGATCCGCGACGAGACGCGCGACGGGTCCTTCCGCTTCACGTCGCGGGCCCTGGGCGCCTCCTTCGTCAGCGACGTCACGCAGCTCGACCTGCAGCGCGTGCACCTGGGCGACTGCGTCCTCCGCGAGGCCTCGGAGGCCATCGACGCCATCTACCGGCGGCGCTACAACAACACGCACGTGCTGGCCGGCGACAAGCCCGAGGTGTACCTCGCCCGCGGGGGCTTCGTGGTGGCCTTCCGCCCGCTGATCTCGAACGAGCTGGCGCAGCTGTACGCGCGCGAGCTCGAGCGCCTCGGCCTCGCCGGCGTCGTGGGCCCCGCGTCCCCCGCGGCCGCCCGTCGGGCCCGGCGCTCCCCCGGCCCGGCGGGGACGCCCGAGCCGCCGGCCGTCAACGGCACGGGGCACCTGCGCATCACCACGGGCTCGGCCGAGTTTGCGCGCCTGCAGTTCACCTACGACCACATCCAGGCGCACGTGAACGACATGCTGAGCCGCATCGCGGCCGCCTGGTGCGAGCTGCAGAACAAGGACCGCACCCTGTGGGGCGAGATGTCGCGCCTGAACCCCAGCGCCGTGGCCACGGCCGCGCTGGGCCAGCGCGTCTCGGCGCGCATGCTCGGCGACGTGATGGCCATCTCGCGGTGCGTGGAGGTGCGCGGCGGCGTGTACGTGCAGAACTCCATGCGCGTGCCCGGCGAGCGCGGCACGTGCTACAGCCGCCCGCTGGTGACCTTCGAGCACAACGGCACGGGCGTGATCGAGGGCCAGCTCGGCGACGACAACGAGCTCCTCATCTCGCGCGACCTCATCGAGCCCTGCACCGGCAACCACCGGCGCTACTTTAAGCTGGGCGGCGGGTACGTGTACTACGAGGACTACAGCTACGTGCGCATGGTGGAGGTGCCCGAGACGATCAGCACGCGGGTGACCCTGAACCTGACGCTGCTCGAGGACCGCGAGTTCCTGCCCCTCGAGGTGTACACGCGCGAGGAGCTCGCCGACACGGGCCTCCTGGACTACAGCGAGATCCAGCGCCGCAACCAGCTGCACGCGCTCAAGTTCTAC
>KJ526432
ATGCCCGCTGGTGGCGGTCTTTGGCGCGGGCCCCGCGGGCATCGGCCCGGGCACCACGGCGGTGCTGGCCTCGGACGTCTTTGGCCTGCTCCACACCACGCTGCAGCTGCGCGGGGCGCCGTCGCGCTAGCGCTGCTGCTGCTGGCGCTCGCCGCGACCCCGACGTGCGGCGCGGCGGCCGTGACGCGGGCCGCCTCGGCCTCGCCCGCGCCCGGGACGGGCGCCACCCCAGACGGCTTCTCCACGGAGGAGTCCCTCGAGGAGATCGACGGGGCCGTCTCCCCCGGCCCCTCGGACGCCCCCGACGGCGAGTACGGCGACCTGGACGCGCGCACGGCCGTGCGCGCGGCCGCGACCGAGCGGGACCGCTTCTACGTCTGCCCGCCGCCGTCCGGCTCCACGGTGGTGCGCCTGGAGCCCGAGCAGGCCTGCCCCGAGTACTCGCAGGGGCGCAACTTCACGGAGGGGATCGCCGTGCTCTTCAAGGAGAACATCGCCCCGCACAAGTTCAAGGCCCACATCTACTACAAGAACGTCATCGTCACGACCGTGTGGTCCGGGAGCACGTACGCGGCCATCACGAACCGCTTCACGGACCGCGTGCCCGTCCCCGTGCAGGAGATCACGGACGTGATCGACCGCCGCGGCAAGTGCGTCTCCAAGGCCGAGTACGTGCGCAACAACCACAAGGTGACCGCCTTCGACCGCGACGAGAACCCCGTCGAGGTGGACCTGCGCCCCTCGCGCCTGAACGCGCTCGGCACCCGCGGCTGGCACACCACCAACGACACCTACACCAAGATCGGCGCCGCGGGCTTCTACCACACGGGCACCTCCGTCAACTGCATCGTCGAGGAGGTGGAGGCGCGCTCCGTGTACCCCTACGACTCCTTCGCCCTGTCCACGGGGGACATCGTGTACATGTCCCCCTTCTACGGCCTGCGCGAGGGGGCCCACGGGGAGCACATCGGCTACGCGCCCGGGCGCTTCCAGCAGGTGGAGCACTACTACCCCATCGACCTGGACTCGCGCCTCCGCGCCTCCGAGAGCGTGACGCGCAACTTTCTGCGCACGCCGCACTTCACGGTGGCCTGGGACTGGGCCCCCAAGACGCGGCGCGTGTGCAGCCTGGCCAAGTGGCGCGAGGCCGAGGAGATGATCCGCGACGAGACGCGCGACGGGTCCTTCCGCTTCACGTCGCGGGCCCTGGGCGCCTCCTTCGTCAGCGACGTCACGCAGCTCGACCTGCAGCGCGTGCACCTGGGCGACTGCGTCCTCCGCGAGGCCTCGGAGGCCATCGACGCCATCTACCGGCGGCGCTACAACAACACGCACGTGCTGGCCGGCGACAGGCCCGAGGTGTACCTCGCCCGCGGGGGCTTCGTGGTGGCCTTCCGCCCGCTGATCTCGAACGAGCTGGCGCAGCTGTACGCGCGCGAGCTCGAGCGCCTCGGCCTCGCCGGCGTCGTGGGCCCCGCGTCCCCCGCGGCCGCCCGTCGGGCCCGGCGCTCCCCCGGCCCGGCGGGGACGCCCGAGCCGCCGGCCGTCAACGGCACGGGGCACCTGCGCATCACCACGGGCTCGGCCGAGTTTGCGCGCCTGCAGTTCACCTACGACCACATCCAGGCGCACGTGAACGACATGCTGAGCCGCATCGCGGCCGCCTGGTGCGAGCTGCATAACAAGGACCGCACCCTGTGGGGCGAGATGTCGCGCCTGAACCCCAGCGCCGTGGCCACGGCCGCGCTGGGCCAGCGCGTCTCGGCGCGCATGCTCGGCGACGTGATGGCCATCTCGCGGTGCGTGGAGGTGCGCGGCGGCGTGTACGTGCAGAACTCCATGCGCGTGCCCGGCGAGCGCGGCACGTGCTACAGCCGCCCGCTGGTGACCTTCGAGCACAACGGCACGGGCGTGATCGAGGGCCAGCTCGGCGACGACAACGAGCTCCTCATCTCGCGCGACCTCATCGAGCCCTGCACCGGCAACCACCGGCGCTACTTTAAGCTGGGCGGCGGGTACGTGTACTACGAGGACTACAGCTACGTGCGCATGGTGGAGGTGCCCGAGACGATCAGCACGCGGGTGACCCTGAACCTGACGCTGCTCGAGGACCGCGAGTTCCTGCCCCTCGAGGTGTACACGCGCGAGGAGCTCGCCGACACGGGCCTCCTGGACTACAGCGAGATCCAGCGCCGCAACCAGCTGCACACGCTCAAGTTCTACGACATTGACCGCGTGGTCAAGGTGGACCACAACGTGGTGCTGCTGCGCGGCATCGCCAACTTCTTCCAGGGCCTCGGCGACGTGGGCGCCGCCGTCGGCAAGGTGGTCCTGGGCGCCACGGGGGCCGTGATCTCGGCCGTCGGCGGCATGGTGTCCTTCCTGTCCAACCCCTTCGGGGCGCTCGCCATCGGGCTGCTGGTGCTGGCCGGCCTGGTCGCGGCCTTCCTGGCCTACCGGCACATCTCGCGCCTGCGCCGCAACCCCATGAAGGCCCTGTACCCCGTCACGACGAAGGCGCTCAAGGAGGACGGCGTCGAAGAGGACGACGTGGACGAGGCCAAGCTGGACCAGGCCCGGGACATGATCCGGTACATGTCCATCGTGTCGGCCCTCGAGCAGCAGGAGCACAAGGCGCGCAAGAAGAACAGCGGGCCCGCGCTGCTGGCCAGCCGCGTCGGGGTGATGGCCACGCGCCGCCGGCACTACCAGCGCCTCGAGAGCGAGGACCCCGACGCCCTGTAG
...................................
建树流程

1.进行多序列比对
软件有:prank、mafft、muscle等。其中prank最准确,但耗费的时间和计算机资源最多,所以一般用于序列少的数据(100条左右的序列)。mafft又比muscle快,适合在大数据量的比对中使用。
2.保守区的选取
Gblocks,输入文件为比对过后的序列文件,能筛选出保守区。
3.寻找适合的model
使用Jmodel找出最适合的模型,用于后续建树的使用,增加可靠性。
4.建树
建树软件有非常多,一般主要用ML和贝叶斯方法,NJ比较适合相似的序列。最好能同时使用ML和贝叶斯两种方法进行建树,然后对比它们结果。

上机操作
序列比对

上机使用muscle进行多序列比对(有机会多尝试几种比对的方法,对比它们的比对结果)。

muscle 下载网址http://www.drive5.com/muscle/downloads.htm

commond

./muscle3.8.31_i86linux64 -in gB.fas -out gB_muscleOut.fas

结果
使用mega打开


image.png
保守区的选择

使用Gblocks服务网站进行保守区的筛选,也可以用本地版的Gblocks

http://molevol.cmima.csic.es/castresana/Gblocks_server.html

将muscle比对后的文件上传至网页。
因为实验中的序列是cds序列,所以应选择codons选项,其他选项不选。
提交后会弹出来一个结果页面:


image.png

等完全载入后,直接下载页面最下方的输出文件(result aligment)

寻找适合的model

先要将上一步得到的blocks序列文件(result aligment)转化成phylips格式文件(使用jmodeltest)#因为忽然连不上服务器,没法重新跑一次流程,就直接粘贴上次用的命令----记得重新跑一次

java -jar jModelTest.jar -d gB_out_muscle_gblocks.fas -getPhylip >gB_out_muscle_gblocks.phy

开始进行model的寻找

java -jar jModelTest.jar -BIC -d gB_out_muscle_gblocks.phy -f -g 4 -i -o gB_out_muscle_gblocks.fas.bic -s 203 -S BEST -tr 50

-s 203表示在203个model(即全部的model)中寻找,如果使用默认值可能有些model会被忽略。

阅读输出文件最后的部分,找出最优模型

tail gB_out_-_gblocks.fas.bic
image.png

此最优模型为 TIM1+I+G 这些需要作为参数输入phyml(本实验使用的建树方法)


image.png

有时需要进行参数的换算,可以参照表格


b90e009a-56c0-4b48-ad3c-230ce7da3a29.png

所以最佳参数为 -m 012230 -a 0.98 -v 0.31

进行进化树的构建

软件的安装(这边使用的是mpi版的)

tar -zvxf phyml-20120412.tar.gz
cd phyml-20120412
mkdir phyml_1
./configure --prefix=/home/wangjl/tree_test/phyml-20120412/phyml_1/ --enable-mpi
make

进化树的构建:

mpirun -np 50 phyml-mpi -i gB_out_-_gblocks.fas.phy -d nt -b 1000 -s BEST -o tlr  -m 012230 -a 0.98 -v 0.31 --no_memory_check  #有一个 -m 参数,需要输入jmodeltest得到的最优模型,具体要研究·jmodeltest和参数说明。-b表示进行1000bootstrap

结果可以用mega或itol查看。
进化树的美化:建议使用itol(http://itol.embl.de/)(通过写配置文件可以实现比较炫的美化效果)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,734评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,931评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,133评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,532评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,585评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,462评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,262评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,153评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,587评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,792评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,919评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,635评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,237评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,855评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,983评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,048评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,864评论 2 354