使用MEGAX构建系统发育树
先进行多序列比对,muscle
, clustalW
, 可参考文献选择一种
区别见:http://blog.sciencenet.cn/blog-54276-314266.html
再进行建树,主要有NJ
, ML
,可参考文献选择一种,或者使用2者锁定同一个结果。
建树参数,检验选1000,模型可以先在MEGA 的MODELS 中 “find best DNA/protein models” ,具有最低BIC分数(BayesianInformation Criterion)的模型被认为是最好地描述替代模式。但最佳模型是以ML找的,MEGA建树时ML、NJ提供的模型并不完全相同,且有些组合模型没有,所以看树的情况吧
MEGAX步骤详见:https://blog.csdn.net/weixin_43643082/article/details/84279196
导出newick格式,或者复制粘贴到txt
iTOL美化
帮助文档 : https://itol.embl.de/help.cgi
注册账号-登录-创建项目-上传树文件或粘贴txt,点树名称页面转到美化界面,默认显示成圆形
树形状的基本操作如是否显示步长检验数值,是否显示支长,是否对齐ID等,根据自身需求设置,略
最简单的上色
【强烈建议】在help页面下载模板和例子的压缩包,先使用例子里的树和注释文件做一遍
以#
开头的行都是注释
第一行:注释内容title
第二行:设定分隔符(TAB,SPACE空格,COMMA逗号)
第三行:DATA
另起一行跟注释的具体内容,格式为 NODE_ID TYPE COLOR LABEL_OR_STYLE SIZE_FACTOR
NODE_ID:最外围就是你的序列ID了,内部的id鼠标单击会弹出名称
TYPE:(结合例子文件理解)
'range': defines a colored range (colored background for labels/clade)
'clade': defines color/style for all branches in a clade
'branch': defines color/style for a single branch
'label': defines font color/style for the leaf label
'label_background': defines the leaf label background color
COLOR:以#开头的颜色值
LABEL_OR_STYLE:LABEL可以修改ID名称,STYLE设置格式如虚线
SIZE_FACTOR:大小
example
叶子背景上色
NODE_ID为上色范围最早的分支;type为range
TREE_COLORS
SEPARATOR TAB
DATA
I148 range #eeffee test1
I110 range #ddddff test2
clade上色
ID没弄懂,欢迎解答
TREE_COLORS
SEPARATOR COMMA
DATA
9031|9606,clade,#0000ff,normal,2
601|340,clade,#ff0000,dashed,2
915|777,branch,#00ff00,dashed,10
9606|5664,branch,#00ff00,dashed,5
更简单的方法,可以直接点击要上色的整个clade的,node,弹出框选择“color”-"set clade color"
最外围加文字
文字较多,只展示下DATA部分
ID用于定文字的位置;-1表示在最外围
DATA
9606,Homo sapiens,-1,#ff0000,bold,0.2,0
4932,Eukaryota,-1,#000000,italic,2,90
160,Bacteria,-1,#0000ff,bold,2,90
2234,Archaea,-1,#0000ff,normal,2,-45
727,Something is here with a long label,-1,#ff0000,bold-italic,0.5,0
在枝上加形状标志
例子文件里的tol_symbol.txt系列
做好即时导出SVG,不订阅无法保存。
iTOL还有很多其他可视化