降维(一)

动机一:压缩数据(Data Compression)

现假设有如下数据集,横坐标为特征变量x1,其单位为厘米(cm);纵坐标为特征变量x2,其单位为英寸(inches)。

我们知道这两个特征变量均为长度计量单位,同时使用不免重复。因此,我们需要将这个二维数据集降为一维数据集。

对于该问题降维的具体做法为:先找到一条合适的直线,然后将数据投影到这条直线上,最后我们将这些投影到直线上的数据用z(i)标识。

降维可以将对存储、内存占用空间减半,使得运行这些数据的算法运行得更快。

下图为三维数据集降为二维数据集的例子。

动机二:数据可视化

我们将数据可视化能让我们更为直观地找寻一个更好的解决方案。但对于维度较高的数据集,我们将其可视化是不可能的。因此,我们可以通过降维使得数据集可视化。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容