新年快乐呀

祝大家新年快乐,身体健康,事业有成!
新的一年要继续学习呀



K均值算法(K-means)聚类
关键词:K个种子,均值
聚类的概念:一种无监督的学习,事先不知道类别,自动将相似的对象归到同一个簇中


  • K-Means步骤总结
    1、从数据中选择k个对象作为初始聚类中心;
    2、计算每个聚类对象到聚类中心的距离来划分;
    3、再次计算每个聚类中心
    4、计算标准测度函数,直到达到最大迭代次数,则停止,否则,继续操作。
    5、确定最优的聚类中心
from sklearn.cluster import KMeans
  
import matplotlib.pyplot as plt
%matplotlib inline
import numpy as np
from sklearn.datasets import make_blobs
  
#生成样本点
X_train,y_train = make_blobs(n_samples=300,centers=4,cluster_std=  0.6, random_state = 9)

# 建立模型
kmeans = KMeans(n_clusters=4)
kmeans.fit(X_train)
y_ = kmeans.predict(X_train)

#画图
plt.figure(figsize = (12,8))
centers = kmeans.cluster_centers_
plt.scatter(X_train[:,0],X_train[:,1],c = y_)
plt.scatter(centers[:,0],centers[:,1],c = 'r',s = 100,alpha = 0.4)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容