如何去除(O)PLS-DA中的样本标签并添加散点

1. 引言

（O）PLS-DA，全称为Orthogonal Partial Least Squares Discriminant Analysis，也就是正交偏最小二乘判别分析，是一种常用的多元线性回归分析方法。它被广泛应用于数据分析、模式识别和机器学习领域，特别是在生物信息学中，用于处理高维度、复杂的生物数据。

（O）PLS-DA的主要目标是找出数据中最能表现出类别差异的方向，使得同一类别的样本在新的坐标系中尽可能近，不同类别的样本尽可能远。它通过PCA（主成分分析）和PLS（偏最小二乘）的结合，建立一个既能解释X（预测变量）的方差又能最大限度地解释Y（应变量）的模型。

2. （O）PLS-DA分析

2.1 加载R包和导入数据

## 加载包
library(ropls)

## 读取数据
expr <- read.table("sample.csv", header = TRUE,sep = ",",row.names = 1)
group_info <- data.table::fread("group.csv", header = TRUE)

expr数据格式

image.png

group_info数据格式

image.png

PLS(DA)分析

2.2 因变量为离散型数据（如性别）时的PLS-DA图

基础得分图

sacurine.plsda <- opls(t(expr), group_info$gender, orthoI = 0)
plot(sacurine.plsda, typeVc = "x-score")

image.png

去除样本名并添加相应的散点

## 设置颜色，颜色是从ropls包源代码中提取出来的
color <- c("blue", "red", "green3", "cyan", "magenta", "#FF7F00", "#6A3D9A", "#B15928", "aquamarine4", "yellow4", "#A6CEE3", "#B2DF8A", "#FB9A99", "#FDBF6F", "#FFFF99")

## 提取画图数据
a <- data.frame(sacurine.plsda@scoreMN)
b <- sacurine.plsda@suppLs$y
levels_b <- sort(levels(factor(b)))
level_to_color <- setNames(color, levels_b)
color_vector <- level_to_color[b]

## 画图
rownames(sacurine.plsda@suppLs$yMCN) <- NULL
plot (sacurine.plsda, type = 'x-score',parPaletteVc = color)
## 可以选择pch来更换散点形状
points(a$p1, a$p2,col = color_vector, pch=16, cex=1)

image.png

2.3 因变量为连续型数据（如age、bmi）时的PLS图

基础图

sacurine.plsda <- opls(t(expr), group_info$bmi, orthoI = 0)
plot(sacurine.plsda, typeVc = "x-score")

image.png

去除样本名并添加相应的散点

## 设置颜色，颜色是从ropls包源代码中提取出来的
scaVc <- rev(rainbow(100, end = 4/6))


## 提取画图数据
a <- data.frame(sacurine.plsda@scoreMN)
b <- sacurine.plsda@suppLs$y
d <- cbind(a,b)
d <- d[order(d$b),]
color <- scaVc[round((d$b - min(d$b, na.rm = TRUE)) / diff(range(d$b, na.rm = TRUE)) * 99) + 1]

## 画图
level_to_color <- setNames(color, d$b)
rownames(sacurine.plsda@suppLs$yMCN) <- NULL
plot (sacurine.plsda, type = 'x-score')
points(d$p1, d$p2,col = level_to_color, pch=16, cex=1)

image.png

OPLS(DA)分析

2.4 因变量为离散型数据（如性别）时的OPLS-DA图

基础得分图

sacurine.oplsda <- opls(t(expr), group_info$gender, predI = 1, orthoI = NA, fig.pdfC = "none")
plot(sacurine.oplsda, typeVc = "x-score")

image.png

去除样本名并添加相应的散点

## 设置颜色，颜色是从ropls包源代码中提取出来的
color <- c("blue", "red", "green3", "cyan", "magenta", "#FF7F00", "#6A3D9A", "#B15928", "aquamarine4", "yellow4", "#A6CEE3", "#B2DF8A", "#FB9A99", "#FDBF6F", "#FFFF99")

## 提取画图数据
a1 <- data.frame(sacurine.oplsda@scoreMN)
a2 <- data.frame(sacurine.oplsda@orthoScoreMN)
a <- cbind(a1,a2)
b <- sacurine.oplsda@suppLs$y
levels_b <- sort(levels(factor(b)))
level_to_color <- setNames(color, levels_b)
color_vector <- level_to_color[b]

## 画图
rownames(sacurine.oplsda@suppLs$yMCN) <- NULL
plot (sacurine.oplsda, type = 'x-score',parPaletteVc = color)
points(a$p1, a$o1,col = color_vector, pch=16, cex=1)

image.png

2.5 因变量为连续型数据（如age、bmi）时的OPLS图

基础图

sacurine.oplsda <- opls(t(expr), group_info$bmi, predI = 1, orthoI = NA, fig.pdfC = "none")
plot(sacurine.oplsda, typeVc = "x-score")

image.png

去除样本名并添加相应的散点

## 设置颜色，颜色是从ropls包源代码中提取出来的
scaVc <- rev(rainbow(100, end = 4/6))
color <- scaVc[round((d$b - min(d$b, na.rm = TRUE)) / diff(range(d$b, na.rm = TRUE)) * 99) + 1]

## 提取画图数据
a1 <- data.frame(sacurine.oplsda@scoreMN)
a2 <- data.frame(sacurine.oplsda@orthoScoreMN)
a <- cbind(a1,a2)
b <- sacurine.oplsda@suppLs$y
d <- cbind(a,b)
d <- d[order(d$b),]
level_to_color <- setNames(color, d$b)


## 画图
rownames(sacurine.oplsda@suppLs$yMCN) <- NULL
plot (sacurine.oplsda, type = 'x-score')
points(d$p1, d$o1,col = level_to_color, pch=16, cex=1)

image.png

参考资料

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,122评论 6赞 505
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,070评论 3赞 395
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,491评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,636评论 1赞 293
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,676评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,541评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,292评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,211评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,655评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,846评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,965评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,684评论 5赞 347
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,295评论 3赞 329
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,894评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,012评论 1赞 269
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,126评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,914评论 2赞 355

如何去除(O)PLS-DA中的样本标签并添加散点

1. 引言

2. （O）PLS-DA分析

2.1 加载R包和导入数据

expr数据格式

group_info数据格式

PLS(DA)分析

2.2 因变量为离散型数据（如性别）时的PLS-DA图

基础得分图

去除样本名并添加相应的散点

2.3 因变量为连续型数据（如age、bmi）时的PLS图

基础图

去除样本名并添加相应的散点

OPLS(DA)分析

2.4 因变量为离散型数据（如性别）时的OPLS-DA图

基础得分图

去除样本名并添加相应的散点

2.5 因变量为连续型数据（如age、bmi）时的OPLS图

基础图

去除样本名并添加相应的散点

参考资料

推荐阅读更多精彩内容