登录注册写文章

线性判别分析（LDA）

井底蛙蛙呱呱呱

线性判别分析（LDA）

线性判别分析（Linear Discriminant Analysis，简称LDA）是一种经典的有监督数据降维方法。LDA的主要思想是将一个高维空间中的数据投影到一个较低维的空间中，且投影后要保证各个类别的类内方差小而类间均值差别大，这意味着同一类的高维数据投影到低维空间后相同类别的聚在一起，而不同类别之间相距较远。如下图将二维数据投影到一维直线上：

上图提供了两种方式，哪一种投影方式更好呢？从图上可以直观的看出右边的比左边的投影后分类的效果好，因此右边的投影方式是一种更好地降维方式。

上图直观的给出了LDA分类的主要思想，下图通过数学公式来推导如何得到这个最佳的投影方式。

二类LDA原理

为了方便解释LDA的原理，我们以二分类为例。

假设现有数据集 D = {(x₁, y₁), (x₁, y₁), ... ,(x_m, y_m)}，其中任意样本x_i为n维向量。定义N_j为第j类样本的个数，X_j为第j类样本的集合，而μ_j为第j类样本的均值向量，Σ𝑗(𝑗=0,1)为第j类样本的"方差"。

因此，原始均值μ_j和投影后的均值μ'_j的表达式为分别为：

注：这里的wi表示第i类，y表示向量x投影后得到的向量

而"方差"则为：

注：这里的wi表示第i类，y表示向量x投影后得到的向量

根据上面LDA主要思想的描述我们的目标就是要投影后最大化类间均值差同时最小化类内方差大小。因此目标函数如下：

上式中，分子表示不同类别均值之差，分母表示不同类别方差之和，因此我们的目标就是最大化J(w)即可。

其中，对于分母：

对于分子：

最后目标函数可转化为：

对J(w)的求解过程如下：

一个简单的例子

总结下LDA算法流程

输入：数据集 D = {(x₁, y₁), (x₁, y₁), ... ,(x_m, y_m)}，任意样本x_i为n维向量，y_i∈{C1, C2, ... , Ck}，共k个类别。现在要将其降维到d维；
输出：降维后的数据集D'。

（1）计算类间散度矩阵 S_B;
（2）计算类内散度矩阵 S_W;
（3）将 S_B 和 S_W 代入上面公式计算得到特征值 λ 和特征向量 w，取前面几个最大的特征值向量λ'与特征向量相乘得到降维转换矩阵 λ'w;
（4）将原来的数据与转换矩阵相乘得到降维后的数据 (λ'w)^Tx ;

参考：
线性判别分析LDA原理总结
 史上最好的LDA(线性判别分析)教程

最后编辑于：2021.08.03 10:24:55

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

主成分分析（PCA）、独立成分分析（ICA）和线性判别分析（LDA）
PCA只对符合高斯分布的样本点比较有效ICA对于高斯分布的样本点无效，对于其他分布的有效。回顾我们之前介绍的《模...
小碧小琳阅读 5,913评论 0赞 4
线性判别分析（LDA）和主成分分析（PCA）
线性判别分析（LDA） Linear Discriminant Analysis 用途：数据预处理中的降维，分类任...
鬼马星mc阅读 2,539评论 0赞 2
用线性判别分析 LDA 降维
本文结构：什么是 LDA 和 PCA 区别 LDA 投影的计算过程 LDA 降维的例子 1. 什么是 LDA 先...
不会停的蜗牛阅读 7,121评论 0赞 20
sklearn学习笔记——线性判别分析LDA
LDA降维 Linear and Quadratic Discriminant Analysis LDA、PDA ...
龙鹰图腾223阅读 7,864评论 0赞 1
广州
今天，我的大哥带我、我姐和我堂哥与堂哥姐乘车一起去广州玩，我大哥才20多岁，就有了一辆自己的车。不愧是广州啊...
莫丰荣阅读 244评论 0赞 1

15赞16赞

赞赏

手机看全文