简要介绍相关性及PCA分析
1、 相关性分析
本次使用数据如下所示:
- 加载数据
data <- read.table('quality.txt',header = T,sep = "\t",row.names = 'Samples')
- 相关性分析
library(corrplot)
corrplot::corrplot(cor(data),type = 'upper',
addCoef.col = 'black')
## 参数:
type: 上半部分
a ddCoef.col: 添加相似值的颜色
结果如下
2、PCA分析
还是用上述数据
- 加载包
library(ggfortify)
library(cluster)
- 基础图形
autoplot(object = prcomp(data), data = data)
#参数解析
# autoplot函数是ggplot包所属的一个函数。可以实现基于特殊对象实现快速绘图。
# object指定绘图对象
# data指定绘图数据集
# prcomp函数基于给定数据集进行PCA分析
# cleandata为进行分析的数据集
- PCA聚类,用pam函数来代替prcomp函
autoplot(object = pam(data, 2), frame = TRUE, frame.type = 'norm')
#参数解析
# pam函数功能类似prcomp函数,区别在于它会将PCA的结果进行K-means聚类分析,在
# 函数的参数中,cleandata为数据集,3为K-means聚类的K值,简单理解就是设置最终聚成几类。
# frame是一个逻辑值,设置是否在聚成一类的数据点周围添加外框来突出展示。
# frame.type设置添加的外框类型,norm代表添加椭圆,默认为多边形
- 继续修改图片
#添加图片标题
autoplot(object = pam(data, 2), frame = TRUE, frame.type = 'norm') +
labs(title="PCA Analysis") +
#图片标题居中,设置字体大小为20
theme(plot.title = element_text(hjust = 0.5 ,size = 20),
#删除图例标题
legend.title = element_blank()) +
#手动指定图列的颜色与名称
scale_fill_manual(values = c('red','blue'),labels = c('A','B')) +
scale_color_manual(values = c('red','blue'),labels = c('A','B'))
** 以上PCA分析内容来自 R语言绘图-PCA图形优化 **