吃瓜3.4 LDA 2023/12/18

线性判别分析 Linear Discriminant Analysis

1 PCA（主成分分析）与LDA

PCA与LDA都是一种降维的方法。
PCA仅关注方差最大的方向，
LDA关注对类别有区分能力的信息。

例：分类下图中的两种数据。如果使用PCA，则会寻找数据投影到哪个方向上方差最大，最后都会投影到下方的坐标轴上。两种数据的投影几乎完全重叠，无法区分。因此需要寻找投影后区分效果最好的方向。
注：PCA笔记尚未完成。

PCAvsLDA

LDA：

Fisher提出
引入样本类别信息
目标：最大化类间方差和类内方差之比

2 算法

给定数据集 $D= \left \{ (\boldsymbol{x_i}, y_i ) \right \} _{i=1}^m, y_i \in \left \{ 0,1 \right \}$ ，
$X_i, \mu_i, \varSigma_i$ 分别表示 $i \in \left \{ 0,1 \right \}$ 类示例的集合、均值向量、协方差矩阵。若将数据投影到直线 $w$ 上，则两类样本中心在直线上的投影分别为 $w^T\mu_0$ 和 $w^T\mu_1$ ，两类样本的协方差分别为 $w^T\varSigma_0w$ 和 $w^T\varSigma_1w$ 。
由于是把二维上的线投影到一维，所以以上四个值均为实数。

要选投影后区分效果最好的方向，也就是要在投影后，让同类的协方差尽可能小（同类的要更聚集），异类的均值之间的距离尽可能大（不同类的要尽量分开）。让尽可能大的做分子，另一个做分母，可得需要最大化的目标：
$\begin{align*} J &= \frac {||w^T\mu_0-w^T\mu_1||_2^2}{w^T\varSigma_0w+w^T\varSigma_1w} \\ &= \frac {w^T(\mu_0-\mu_1)(\mu_0-\mu_1)^Tw}{w^T(\varSigma_0+\varSigma_1)w} \end{align*}$