非度量多维尺度分析(Non-metric multidimensional scaling,NMDS)是间接梯度分析方法,其基于距离或不相似矩阵产生排序。与尝试最大化排序中的对象之间的方差或对应关系的方法不同,NMDS试图尽可能接近地表示低维空间中的对象之间的成对不相似性。可以使用任何相异系数或距离度量来构建用作输入的距离矩阵。
NMDS是一种基于排名的方法。这意味着原始距离数据被等级替换。因此,对象A不是距离对象B远离2.1个单位、对象C远离4.4个单位,对象C是对象A的“第一”远,而对象B是对象B的“第二”远。虽然丢失了关于距离大小的信息,但基于秩的方法通常对于没有可识别分布的数据更稳健。
如果排序的目的不是最大限度地保留对象之间的实际距离,只是反映对象之间的顺序关系,这个时候NMDS是一种可行的解决方案。NMDS与PCoA同属于多维尺度分析(multidimensional scaling,MDS),与PCoA一样,NMDS可以基于任何类型距离矩阵对对象进行排序。与PCoA不同的是,NMDS不再基于距离矩阵数值,而是基于排位顺序进行计算,是非线性的模型能更好的反映生态数据。
NMDS 计算过程:
- 预先设定排序轴的数量m
- 在m维空间内构建对象的初始结构,初始结构是调整对象之间位置关系的起点。通常,PCoA是一个很好的初始结构。
- 在m维空间内,用一个迭代程序不断调整对象位置,目标是不断最小化应力函数(stress function,其值被转化为0~1 之间的数值)。
- 不断调整对象位置,直至应力函数值不再减少,或已达到预定的值。
- 大部分NMDS会根据PCA结果旋转最终的排序图,使结果更容易解读。
# 导入本章所需的程序包
library(ade4)
library(vegan)
library(gclus)
library(ape)
rm(list = ls())
setwd("D:\\Users\\Administrator\\Desktop\\RStudio\\数量生态学\\DATA")
# 导入CSV文件数据
spe <- read.csv("DoubsSpe.csv", row.names=1)
env <- read.csv("DoubsEnv.csv", row.names=1)
spa <- read.csv("DoubsSpa.csv", row.names=1)
# 删除没有数据的样方8
spe <- spe[-8,]
env <- env[-8,]
spa <- spa[-8,]
# 基于鱼类数据Bray-Curtis距离矩阵的NMDS排序
# ****************************************
spe.nmds <- metaMDS(spe, distance="bray")
spe.nmds
spe.nmds$stress
plot(spe.nmds, type="t", main=paste("NMDS/Bray-应力函数值=", round(spe.nmds$stress,3)))
#当前生成的排序图与PCA、CA和PCoA的排序图进行比较,有什么不同?
# 评估NMDS拟合度的Shepard图
par(mfrow=c(1,2))
stressplot(spe.nmds, main="Shepard图")
gof = goodness(spe.nmds)
plot(spe.nmds, type="t", main="拟合度")
points(spe.nmds, display="sites", cex=gof*200)
NMDS排序图内加聚类分析结果
spe.bray <- vegdist(spe)
# 基于Bray-Curtis相异矩阵Ward聚类结果(提取4组)
spe.bray.ward <- hclust(spe.bray, "ward")
spe.bw.groups <- cutree(spe.bray.ward, k=4)
grp.lev <- levels(factor(spe.bw.groups))
# 与NMDS结果进行组合
sit.sc <- scores(spe.nmds)
p <- ordiplot(sit.sc, type="n", main="NMDS/Bray + clusters Ward/Bray")
for (i in 1:length(grp.lev)) {
points(sit.sc[spe.bw.groups==i,], pch=(14+i), cex=2, col=i+1)
}
text(sit.sc, row.names(spe), pos=4, cex=0.7)
# 添加聚类树
ordicluster(p, spe.bray.ward, col="dark grey")
legend(locator(1), paste("Group",c(1:length(grp.lev))),
pch=14+c(1:length(grp.lev)), col=1+c(1:length(grp.lev)), pt.cex=2)
参考
NMDS非度量多维尺度分析
Non-metric multidimensional scaling
我的StatQuest生物统计学专题(15)-MDS
Analyzing Social Networks Using Non-Metric Multidimensional Scaling