多序列比对(Multiple Sequence Alignment,简称 MSA)大家应该都不陌生了吧!这是用于比较多个序列相似性和差异性的常用分析方法。
在 Linux 系统中,常用的多序列比对工具包括 ClustalW、Muscle 和 MAFFT 等,而在 Windows 系统中常见的选择是 Mega。
在这里,我们将介绍如何直接在 R 中绘制多序列比对的结果。
内容包括,多序列比对、构建 NJ 树,以及绘制和保存环形与长方形进化树。
我们这里以跑10条左右的序列为例子,并提供2个代码。
代码1:


注:这里生成的树文件就可以用MEGA或者iTOL润色了。
以下是一个完整的代码

1)FASTA 文件处理与多序列比对:从指定的 FASTA 文件读取序列,并进行蛋白质类型的多序列比对。
2)计算距离矩阵:基于比对结果,计算序列之间的距离矩阵,使用 dist.alignment()。
3)生成邻接法树:使用邻接法(Neighbor-Joining)生成系统发育树,nj() 函数完成这一步。
4)保存树文件:将生成的树以 Newick 格式保存为 phylogenetic_tree.newick 文件。
5)树图绘制:① 绘制三种类型的树图(无根树、圆形树、矩形树),并分别保存为 PNG 图像文件。② 树图会进行美化设置(树枝颜色、宽度、标签大小等)。
6)生成的文件:

① aligned_sequences.fasta: 存储比对后的FASTA序列。
② phylogenetic_tree.newick: 存储生成的树的 Newick 格式。
③ unrooted_phylogenetic_tree.png: 无根树图。
④ Circular_phylogenetic_tree.png: 圆形树图。
⑤ rectangular_phylogenetic_tree.png: 矩形树图。
代码2:

① 该代码首先执行多序列比对,并生成距离矩阵用于 NJ 树构建。
② 利用 ggtree 绘制 NJ 树的环形和长方形布局,分别保存为 PDF。
③ 使用 ggmsa 对原始序列文件进行可视化,生成比对图并保存为 PDF。
生物信息学领域非常广泛,难以一次说尽。我们下次继续更新,一起深入学习生物信息学的内容!
喜欢的宝子们点个赞吧~码字不易,且行且珍惜~