from sklearn.cluster import KMeans
import numpy as np
X = np.array([[1, 2], [1, 4], [1, 0],
[4, 2], [4, 4], [4, 0]])
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)
kmeans.labels_
kmeans.predict([[0, 0], [4, 4]])
kmeans.cluster_centers_
X = np.array([[1, 2], [1, 4], [1, 0], [4, 2], [4, 4], [4, 0]])
X应看作是有六个元素的集合,每个元素的信息是用二维表示的
然后通过kmeans生成一个分类器,生成分类器的标志是fit()函数
然后可以拿数据去预测。
这是一般通用的要走的流程
但是kmeans要预测的就是自己本身,所有可以有另一种写法
y_pred = [KMeans](n_clusters=3, random_state=random_state).fit_predict(X_aniso)
返回的就是要分类的数据自己的结果,结果是一个由0、1、2组成的集合