前言
Matlab中关于pca函数的说明写得并不直观,很多人最直接的目的只是想得到pca降维后的结果,但是根据官方解释文档,很难一下看出哪个输出参数才是最终降维后的特征。因此,本文记录如何使用Matlab中自带的pca函数对数据进行降维。
PS. 本文并不详解pca的原理,仅仅记录如何使用Matlab中的pca函数。
使用
[coeff, score] = pca(X)
输入参数:X是n x d的样本矩阵,其中n表示样本数,d表示特征纬度。
输出参数:
(1)coeff是主成分分量,即样本协方差矩阵的特征向量。
(2)score是主成分,即样本X在低维空间的投影,也就是我们想要得到的降维后的数据。
注意:score的维度和原始样本X的维度一致,若需要降到k维,则只需要取score的前k列即可。
res = score(:, 1:k);
利用coeff得到score
此外,也可以根据coeff计算得到score,以下是具体步骤:
(1)计算样本X沿特征纬度的均值向量(因为X的每一列代表一个特征,因此此时是按照行计算均值):
M = mean(X, 1)
(2) 利用去中心后的X乘上coeff便可以得到score:
test = (X-M)*coeff
测试代码
X = rand(100,50);
[coeff, score] = pca(X);
M = mean(X,1);
test = (X-M)*coeff;
res = sum(sum(test-score));
运行后便可以看到res的结果非常非常小,此时便说明test和score非常接近。