无监督学习就是聚类问题:
1、 聚类算法K-means
2、如何选取初始值
3、如何选择划分类别的数量K
K-means算法
过程就是计算各个点到类中心点的距离,将其归类到距离最近的那个类,然后移动中心点,再次计算,直到最优。
初始值
一种方法随机产生值,一种是在样本中随机选取K个值,都可能出现某些类的中心值过于靠近,可以重复多次随机选取初始值,多次计算中心值。
类别K的选择
一种是理想的肘拐理论,实际的情况要结合实际解决问题的场景来选择。
无监督学习就是聚类问题:
1、 聚类算法K-means
2、如何选取初始值
3、如何选择划分类别的数量K
过程就是计算各个点到类中心点的距离,将其归类到距离最近的那个类,然后移动中心点,再次计算,直到最优。
一种方法随机产生值,一种是在样本中随机选取K个值,都可能出现某些类的中心值过于靠近,可以重复多次随机选取初始值,多次计算中心值。
一种是理想的肘拐理论,实际的情况要结合实际解决问题的场景来选择。