这两天查阅关于空间聚类方法的文献,发现近年的研究热点是高维数据的聚类方法。在大数据背景下,不仅数据量增大,数据的维度也自低变高,从过去的一维、二维为主,变成如今的成百上千维,可谓维度灾难,维度数量很高的数据也被称为高维数据。
对于高维数据的聚类,传统的聚类方法难以胜任,新的常用思路就是基于降维的聚类,一种是直接对数据集进行降维再处理,一种是先把高维数据划分为若干不同的子空间,再根据需要在不同的子空间寻求聚类。
无论哪种方法,核心的思想都是在面临超高维度的复杂性时,化繁为简,降维打击。
我不禁联想到人类的成长也是一个维度自低升高的过程——当我们幼年时,只需关心吃、玩、睡;上学后,在此基础上增加两个维度,学习和朋友;青春期,再增加性懵懂和价值体现迷茫;工作后,又增加工作、挣钱、社会价值;随着年龄的增长,子女养育、父母赡养、自身健康。。。越来越多的问题需要面对和解决,我们面临的问题维度也变为了“高维数据”,时间金钱精力都有限,如何快速最优的解决高维问题?
当然这里首先需要一个很好的人生规划,这是道法术里的道。在不同的人生阶段,或者时间片段里,如何尽快从一团乱麻中把问题“聚类”集中高效处理,避免鸡飞狗跳、一地鸡毛的结果发生,是道法术里的法,可以参考基于降维的思想。
比如,人到中年,工作中,随着年龄、经验、资历的增长,面对的工作千头万绪;而同时家里孩子需要教育,校内校外事情也一大堆;父母年龄也大了,身体各种出毛病。。。如果处理不好,问题接踵而来,焦头烂额,雪上加霜,一地鸡毛是大概率的结果。
如何避免以上糟糕境况的演绎?是否可以学习高维数据的降维处理方法?一大波问题袭来不要怕,先发个朋友圈。。。不对,先降维处理——首先按照问题领域在人生规划中的投影等方面提取特征,把不太重要的问题过滤掉,然后再结合常规的问题处理法则,分出轻重缓急、难易程度等进行处理。给身体和心灵做减法,让身心灵在一起,把不必要的欲望摒弃掉。(未完待续)