白化的目的:降低输入的冗余性;
或者说
我们希望通过白化过程使得学习算法的输入具有如下性质:
(i)特征之间相关性较低;
(ii)所有特征具有相同的方差
PCA白化
降维后的矩阵可以表示为:redX = X(m x n) * U(n x k)
所谓的PCA白化就是对降维后的数据redX 的每一列除以其特征值的根号
ZCA白化
也就是在原来PCA结果上(不降维)左乘一个特征向量矩阵。
对所有可能的R,这种旋转使得Xzca白化尽可能地接近原始数据x。
当使用ZCA白化时,我们通常保留数据的全部n个维度,不尝试去降低它的维数。