多序列比对+绘制进化树+多序列比对logo图

多序列比对(Multiple Sequence Alignment,简称 MSA)大家应该都不陌生了吧!这是用于比较多个序列相似性和差异性的常用分析方法。

在 Linux 系统中,常用的多序列比对工具包括 ClustalW、Muscle 和 MAFFT 等,而在 Windows 系统中常见的选择是 Mega。

在这里,我们将介绍如何直接在 R 中绘制多序列比对的结果。

内容包括,多序列比对、构建 NJ 树,以及绘制和保存环形与长方形进化树。

我们这里以跑10条左右的序列为例子,并提供2个代码。

代码1:

安装包并写入文件
计算距离矩阵、画树并生成树文件

注:这里生成的树文件就可以用MEGA或者iTOL润色了。


以下是一个完整的代码

生成3张树图

1)FASTA 文件处理与多序列比对:从指定的 FASTA 文件读取序列,并进行蛋白质类型的多序列比对。

2)计算距离矩阵:基于比对结果,计算序列之间的距离矩阵,使用 dist.alignment()。

3)生成邻接法树:使用邻接法(Neighbor-Joining)生成系统发育树,nj() 函数完成这一步。

4)保存树文件:将生成的树以 Newick 格式保存为 phylogenetic_tree.newick 文件。

5)树图绘制:① 绘制三种类型的树图(无根树、圆形树、矩形树),并分别保存为 PNG 图像文件。② 树图会进行美化设置(树枝颜色、宽度、标签大小等)。

6)生成的文件:

t.fa为输入文件

① aligned_sequences.fasta: 存储比对后的FASTA序列。

② phylogenetic_tree.newick: 存储生成的树的 Newick 格式。

③ unrooted_phylogenetic_tree.png: 无根树图。

④ Circular_phylogenetic_tree.png: 圆形树图。

⑤ rectangular_phylogenetic_tree.png: 矩形树图。


代码2:

需要代码call me

① 该代码首先执行多序列比对,并生成距离矩阵用于 NJ 树构建。

② 利用 ggtree 绘制 NJ 树的环形和长方形布局,分别保存为 PDF。

③ 使用 ggmsa 对原始序列文件进行可视化,生成比对图并保存为 PDF。



生物信息学领域非常广泛,难以一次说尽。我们下次继续更新,一起深入学习生物信息学的内容!

喜欢的宝子们点个赞吧~码字不易,且行且珍惜~

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
禁止转载,如需转载请通过简信或评论联系作者。

相关阅读更多精彩内容

友情链接更多精彩内容