2022-12-09对应分析&典型相关分析

对应分析(Correspondence analysis)是因子分析的进一步推广,它是利用降维的思想把R型(对变量或指标)因子分析和Q型(对样本)因子分析统一起来,利用过渡矩阵,通过R型因子分析直接得到Q型因子分析的结果,同时把变量(指标)和样本反映到同一坐标系上,以此来说明变量与样本之间的对应关系。

多元统计分析R语言建模|对应分析

1. 简单对应分析

简单对应分析是对两个分类变量进行对应分析,建立变量中类别之间的对应关系。

# 加载包
library(ca)
library(dplyr)
# 加载数据
data(HairEyeColor)

# 使用卡方检验判断行、列变量是否独立
data1 <- HairEyeColor[,,1] 
data2 <- HairEyeColor[,,2]
chisq.test(data1)
chisq.test(data2)
## p<0.05,数据的行、列变量是不独立的

# 对应分析
smca1 <- ca(data1)
summary(smca1)

smca2 <- ca(data2)
summary(smca2)

# 分析结果可视化
plot(smca1,main = "Male HairEyeColor")
plot(smca2,main = "Female HairEyeColor")

## 在男性的对应分析图中,黑发和棕色眼睛离得很近,金发和蓝色眼睛离得很近,
## 红发和绿色眼睛离得很近,说明男性存在黑发棕色眼睛、金发蓝色眼睛、
## 红发绿色眼睛这样的事实情况;而女性也存在这样的情况。
男性对应分析结果.png

女性对应分析结果

2. 多重对应分析

# 判断3个分类变量是否独立
library(MASS)
loglm(~Sex+Hair+Eye,data=HairEyeColor)
## p>0.05,说明3个变量之间不是成对独立的

# 多重对应分析
mca <- mjca(HairEyeColor)
summary(mca)

# 分析结果可视化
par(family = "STKaiti")
plot(mca,mass = c(TRUE,TRUE),col = c("black","red","green","blue"),
    main="三维列联表对应分析")

## Sex=Female、Sex=Male和Hair=Brown的距离较近,说明无论男性还是女性都是棕色头发居多;
## Sex=Female和三种颜色的距离都差不多,说明女性的眼睛颜色较随机;
## Sex=Male和Eye=Hazel和距离较近,说明男性眼睛偏向于淡褐色。
多重对应分析结果

典型相关分析(Canonical correlation analysis)是研究两组变量之间相关关系的多元统计分析方法。它主要利用主成分降维的思想,分别对两组变量提供主成分,从而将研究两组变量的相关性问题转化成研究两个变量的相关性问题。

# 加载包
library(candisc)

# 加载数据
data(Wine)

# 数据处理
wine <- as.data.frame(scale(Wine[,2:14]))
wine_x <- wine[,1:6]
wine_y <- wine[,7:13]

# 典型相关分析
winecca <- candisc::cancor(wine_x,wine_y)
summary(winecca)
# 典型相关分析可视化
par(mfrow = c(3,2))
plot(winecca,which = 1)
plot(winecca,which = 2)
plot(winecca,which = 3)
plot(winecca,which = 4)
plot(winecca,which = 5)
plot(winecca,which = 6)
## 六对典型相关变量均为正相关,其中第一对典型相关变量的相关系数为0.9,强正相关。
典型相关分析
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容