夯实基础|Deep Learning(更新中🤔)

主成分分析(Principle Components Analysis, PCA)

主成分分析是一个简单的机器学习算法,是一种通过降维技术把具有相关性的多个变量化为少数几个主成分的统计方法。用于解决做数据分析处理时,数据往往包含多个变量,而较多的变量会带来分析问题的复杂性问题。
算法流程:
输入:n 维样本集D=(x^{(1)}, x^{(2)}, ..., x^{(m)})
输出:降维后的维度 n',样本集D'
(1) 对所有样本中心化:x^{(i)}=x^{(i)}-\frac 1 m \sum_{j=1}^mx^{(j)}
(2) 计算样本的协方差矩阵XX^T
(3) 对矩阵XX^T进行特征值分解
(4) 取出最大的n'个特征值对应的特征向量(w_1,w_2,...,w_n′), 将所有的特征向量标准化后,组成特征向量矩阵W。
(5) 对样本集中的每一个样本x(i),转化为新的样本z^{(i)}=W^T𝑥^{(𝑖)}
(6) 得到输出样本集D'=(z^{(1)}, z^{(2)}, ... , z^{(𝑚)})

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容