PCA图我们之前讲过了(转录组不求人系列(三):PCA分析及CNS级别作图),作图方式也是NCS级别的,但是之前的图是2D版,也就是将多维数据降维2个主成分,在平面坐标轴中观察。但是如果想再增加一个主成分就需要3D版的PCA图了。3D版的PCA也是很多高分文章喜欢展示的图,所以这里我们就对之前的作图升级一下。但是重点是选择适合自己实际情况的数据,不能一味看作图。
首先做一个PCA分析,和之前一样,用PCA分析结果去作图。
setwd("F:/生物信息学")
A <- read.csv("A.csv",header = T,row.names = 1)
A <- A[apply(A, 1, sum) > 0, ]
data <- t(A)#PCA分析需要将表达矩阵转置
data.pca <- prcomp(data, scale. = T) #这是后续作图的文件
加载数据包并定义分组
library(scatterplot3d)#画3D散点图的包
library(dplyr)
group=c(rep("Mcc",6),rep("Pan",6))
pca.result<-as.data.frame(data.pca$x)
pca.result$group<-group
scatterplot3d(pca.result[,1:3])#基本画图,选取三个主成分,分别为x,y,z,三位坐标
这样就得到一个基本的散点图:
接下来,添加颜色,分组:
pca.result = pca.result %>% mutate(colour = case_when(
pca.result$group == "Mcc" ~ "#CC0000",
pca.result$group == "Pan" ~ "#2f5688",
)) #定义分组并设置颜色
scatterplot3d(pca.result[,1:3],color=pca.result$colour,
pch = 16,angle=30,
cex.symbols = 2,
box=T,type="p",
main = "3D PCA Plot",
lty.hide=2,lty.grid = 2)
legend("bottom",c("Mcc","Pan"),fill=c('#CC0000',"#2f5688"),
horiz = T)#添加图例
当然,scatterplot3d还可以将每个样本点的名称显示在图上,这样就无需legend了。
sd3 <- scatterplot3d(pca.result[,1:3],color=pca.result$colour,
pch = 16,angle=30,
cex.symbols = 2,
box=T,type="p",
main = "3D PCA Plot",
lty.hide=2,lty.grid = 2)
text(sd3$xyz.convert(pca.result[,c("PC1","PC2","PC3")]+0.05),
labels = rownames(pca.result),
cex=1,col="black")
------------------------------分割线-----------------------------------------
除了scatterplot3d,还有一些R中使用的交互式的包画3D图,可以自己调整。但是有一个问题没有解决,那就是无法添加legend,还有不能导出图片。但是在python中可以实现,这里抛砖引玉,感兴趣的小伙伴可以探索下教教大家。
library(car)
library(rgl)
scatter3d(pca.result$PC1,
pca.result$PC2,
pca.result$PC3,
surface = F,
point.col = rep(c('red2','green3'),
c(6, 6)),
xlab = paste('PCA1'),
ylab = paste('PCA2'),
zlab = paste('PCA3'))
还可以添加置信椭圆:
scatter3d(pca.result$PC1,
pca.result$PC2,
pca.result$PC3,
groups = as.factor(pca.result$group),
surface = FALSE, ellipsoid = TRUE,
ellipsoid.alpha=0.2,
xlab = paste('PCA1'),
ylab = paste('PCA2'),
zlab = paste('PCA3'),
grid=F)
此外,plot3d函数也能达到这种效果,但依然面临一样的问题!希望有小伙伴分享解决办法!!!