K-均值算法(K-means algorithm)

K-均值算法概述:

首先,我们有一个无标签数据集,我们想要把它们分成两个类,然后我们使用k-均值算法来做:

1、我们选取两个点,称为聚类中心(cluster centroids):

2、遍历所有的点,更靠近哪个聚类中心,就把它归为那一个类中:

3、移动聚类中心到它们自己类的均值处:

4、然后我们继续第2步,遍历所有的点,看它离哪个聚类中心更近就把它归到那一类中:

5、继续第3步,移动聚类中心到它们自己类的均值处:

6、继续第2步:

7、继续第3步:

8、继续第2步:

如此反复,当点的颜色不再变化,我们便认为K均值方法已经收敛了。

输入:

  • K(聚类数)
  • 训练集{x(1),x(2),......,x(m)}

对于没有明显区分的数据也可以很好的分开:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • K-Means介绍 K-means算法是聚类分析中使用最广泛的算法之一。它把n个对象根据他们的属性分为k个聚类以便...
    严国华阅读 815评论 0 0
  • 均值算法是一种典型的无监督学习算法,用来对数据进行分类。 聚类问题 Clustering 针对监督式学习,输入数据...
    kamidox阅读 2,897评论 5 10
  • 你体验过这种感觉吗? 当你阅读一本书的时候,你突然发现自己原来是个傻子。 我猜你没有体验过,毕竟,这不仅需要你善于...
    颜悬哉阅读 1,655评论 18 54
  • 1 过完年后,公司传闻说萧迪恋爱了。 这在我们单位绝对是个爆炸性的新闻,谁才有能耐收复35岁的高冷女神萧迪呢?于是...
    安小渔阅读 858评论 3 2