1.目的
使用phylosuite软件完成叶绿体基因组CDS与全长系统发育的基因矩阵准备。本教程针对的是windows版本的phylosuite使用。
2.使用
2.1导入数据
如图一所示点击import files or IDs,然后会跳转到图二,①是从电脑文件中导入,导入的数据格式为gb文件,适合导入的数据类型为自己注释的叶绿体还未上传至NCBI(即未获得登录号)。②是使用Genebank登录号下载NCBI数据库中的数据,这种方法适用于数据量多,或者NCBI数据库上有登录号的数据,只需要把登录号粘贴到框中后点击Start便开始下载(如③)。
2.2提取序列
当数据下载完成后会会在数据框中显示,如图三,选中其中一个数据Ctrl+A键全选右键Extract默认参数Strat
2.3 mafft比对
如图四所示,先点击extract_result(①)文件夹选中要比对的文件夹右键import to MAFFT图五
如图五所示,如果只需要CDS建树就只进行一次比对,选择PCGs即可,如果需要全长建树,则还需要选择RNAs进行一次比对,且后续步骤需要分别对CDS和RNA进行处理。
2.4Trim AI裁剪序列
当上一步完成后先点击mafft_results文件夹选中需要选中的文件右键Import to trimAI再按图七操作
2.5 序列连接
对于CDS建树的,可以直接按图八进行操作,但对于全基因组建树,则需要先将RNA和CDS的裁剪结果放到同一个文件夹后再进行拼接