2019-01-21初始化k均值

如何初始化聚类中心?

随机初始化

K均值方法最终可能会得到不同的结果取决于聚类簇的初始化方法。

局部最优

K均值方法初始化落在局部最优的时候,最后的聚类结果会产生影响。真正的K均值方法所遇到的局部最优且通过最小化这个失真函数J并不能得到很好的结果。

因此如果担心K均值方法会遇到局部最优的问题,如果想提高K均值方法找到最有可能的聚类的几率的话, 能做的是尝试多次随机的初始化,而不是仅仅初始化一次K均值方法就希望它会得到很好的结果。初始化K均值很多次并运行K均值方法很多次通过多次尝试来保证我们最终能得到一个足够好的结果,一个尽可能局部或全局最优的结果。

随机初始化

事实证明,如果你运行K均值方法时所用的聚类数相当小,那么如果聚类数是从2到10之间的任何数的话做多次的随机初始化,通常能够保证你能有一个较好的局部最优解,保证你能找到更好的聚类数据。但是如果K非常大的话,如果K比10大很多,有多个随机初始化就不太可能会有太大的影响,更有可能你的第一次随机初始化就会给你相当好的结果。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 均值算法是一种典型的无监督学习算法,用来对数据进行分类。 聚类问题 Clustering 针对监督式学习,输入数据...
    kamidox阅读 2,893评论 5 10
  • 一、K-means聚类介绍 聚类是一种无监督的学习,它将相似的对象归到同一个簇中。它有点像全自动分类 。聚类方法几...
    nobodyyang阅读 935评论 0 0
  • 秋天的天气总是令人懊恼。明明中午热的要命,早晚却冷的要死。就像人们谈恋爱:由不认识的冷漠,到热恋的无比热情,再到分...
    诶呦我的小文艺阅读 286评论 3 1
  • 前两天正播到杨紫扮演的职场菜鸟小蚯蚓因为检举前男友贪污被解雇了,今天闲来谈谈职场菜鸟的禁忌吧,我抛个砖,大家紧跟补...
    酷听听书阅读 372评论 0 0
  • 1 “我听见雨滴落在青青草地,我听见远方下课钟声响起,可我没有听见你的声音,认真,呼唤我姓名。” 看《我的少女时代...
    许沐笙阅读 1,008评论 16 38