ggtree:一款强大的R语言绘制生物进化树工具

在生物信息学和进化生物学领域,树状图(phylogenetic trees)是用来表示物种之间进化关系的重要工具。ggtree是一个基于ggplot2的R包,专门用于可视化进化树,支持多种树状图的格式,如Newick、Nexus、PhyloXML等,它不仅能绘制基础的进化树,还能结合数据在树上进行注释和高级自定义,是进化分析中不可或缺的工具之一。

安装ggtree

要安装ggtree,你需要先确保已经安装了R和Bioconductor。ggtree作为Bioconductor的一部分,可以通过以下命令安装:

if (!requireNamespace("BiocManager", quietly = TRUE))
    install.packages("BiocManager")

BiocManager::install("ggtree")

ggtree使用示例

接下来,我们将通过几个不同的例子来展示ggtree的强大功能。

示例1:基础进化树绘制

首先,我们需要一个进化树的数据。这里,我们使用ggtree自带的一个示例数据集。

library(ggtree)
tree <- rtree(10) # 生成一个包含10个物种的随机进化树
ggtree(tree) + geom_tiplab() # 绘制进化树,并在末端添加物种标签

[图片上传中...(image.png-1a95f8-1712712160088-0)]

这段代码会生成一个基础的进化树,每个物种在树的末端都有标签。


示例2:进化树上添加注释

ggtree支持在进化树上添加多种注释,比如高亮某些分支、添加图形标记等。

ggtree(tree) +
  geom_tiplab() +
  geom_highlight(node=5, fill="lightblue") + # 高亮显示编号为5的节点
  geom_nodelab(aes(label=node), nudge_x=0.5) # 在节点旁添加节点编号

这段代码在基础进化树的基础上,高亮了编号为5的节点,并在每个节点旁边添加了节点编号。


示例3:绘制圈状图

library("ggplot2")
library("ggtree")
library("colorspace")
treFile="input.tre"           #进化树文件
groupFile="group.txt"         #树枝分类
outFile="tree.pdf"            #输出

#读取属性文件,把属性信息保存到list
cls=list()
rt=read.table(groupFile,sep="\t",header=T)
for(i in 1:nrow(rt)){
    otu=as.character(rt[i,1])
    phylum=as.character(rt[i,2])
    cls[[phylum]]=c(cls[[phylum]], otu)
}
phylumNames=names(cls)
phylumNum=length(phylumNames)

#读取进化树文件,和属性文件合并
tree=read.tree(treFile)
tree=groupOTU(tree, cls)

#绘制
pdf(file=outFile, width=8, height=8)
ggtree(tree, 
       layout="circular", 
       ladderize = F, 
       branch.length="none", 
       aes(color=group)) + 
       scale_color_manual(values=c(rainbow_hcl(phylumNum+1)),breaks=phylumNames, labels=phylumNames ) + 
       theme(legend.position="right") + 
       geom_text(aes(label=paste("                ",label,sep=""), 
       angle=angle+45), 
       size=2)
dev.off()

  1. 加载所需的包:ggplot2、ggtree和colorspace。

  2. 定义变量:

    • treFile:进化树文件的路径。
    • groupFile:树枝分类的属性文件路径。
    • outFile:输出文件的路径。
  3. 读取属性文件,并将属性信息保存到cls列表中。

    • cls:一个列表,以属性值(例如“phylum”)作为键,对应的样本编号列表作为值。
  4. 读取进化树文件,并根据属性文件合并属性信息到树中。

    • tree:从进化树文件中读取的进化树对象。
    • groupOTU:自定义函数,用于将属性信息合并到进化树中的叶节点(OTU)。
  5. 绘制进化树:

    • 使用ggtree函数绘制树,设置布局为圆形(layout="circular")。
    • ladderize = F:不对树进行阶梯化处理。
    • branch.length="none":不显示分支长度。
    • 使用aes(color=group)对树的分支进行着色,着色的属性为group
  6. 设置颜色:

    • 使用scale_color_manual手动设置颜色映射,使用rainbow_hcl函数生成不同类别的颜色,类别数为phylumNum+1(属性值的数量加一,为了保证颜色不重复)。
    • breaks=phylumNames, labels=phylumNames:设置颜色映射的标签,即属性值的名称。
  7. 设置图例位置为右侧(theme(legend.position="right"))。

  8. 使用geom_text添加文本标签,标签内容为label,并根据angle+45设置标签的角度偏移,size=2设置标签的大小。

  9. 最后,将绘制的图保存为PDF文件(pdf(file=outFile, width=8, height=8)),并关闭绘图设备(dev.off())。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容