随记1:2


K-Means

1.随机选取k个质心点

2.计算各个点到质心的距离

3.将点的类划分为离他最近的质心,形成K个cluster

4.根据分好类的cluster,在每一个cluster内重新计算质心(平均每个点的值)

5.重复2~4知道满足迭代次数或者误差小于指定的值。


K-Medoids

1.随机选取K个质心的值

2.计算各个点到质心的距离

3.将点的类划分为离他最近的质心,形成K个cluster

4.根据分好类的cluster,在每个cluster内重新计算质心:(将中心点限制在当前的cluster所包含的的据点的集合中,也就是我们将从当前cluster中选取这样一个点——它到其他所有(当前cluster中的)点的距离之和最小)

            4.1 计算cluster内所有样本点到其中一个样本点的曼哈顿距离和绝对误差

            4.2  选出使cluster绝对误差最小的样本点作为质心点

5.重复迭代2~4步直到满足迭代次数或者误差小于指定的值


区别:k-means的质心是各个样本点的平均,可能是样本点中不存在的点。

           k-medoids的质心一定是某个样本点的值。

k-means 和 k-medoids 之间的差异就类似于一个数据样本的均值 (mean) 和中位数 (median) 之间的差异:前者的取值范围可以是连续空间中的任意值,而后者只能在给样本给定的那些点里面选。

 2018.9.5

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 聚类算法 前面介绍的集中算法都是属于有监督机器学习方法,这章和前面不同,介绍无监督学习算法,也就是聚类算法。在无监...
    飘涯阅读 41,611评论 3 51
  • K-Means原理K-Means算法的思想很简单,对于给定的样本集,按照样本之间的距离大小,将样本集划分为K个簇。...
    yalesaleng阅读 10,440评论 0 6
  • 与 TensorFlow 的初次相遇 https://jorditorres.org/wp-content/upl...
    布客飞龙阅读 9,345评论 2 89
  • 一、一个简单的学习案例 二、vuex工作原理 state 从 store 实例中读取状态最简单的方法就是在计算属性...
    puxiaotaoc阅读 2,187评论 0 0
  • 相识,不觉一年又一年, 人生弥散在那些无悔的岁月里。 不是每个擦肩过的人都会相识, 也不是每个相识的人都会让人牵挂...
    鑫华阅读 4,845评论 5 17