第2大题 - 简书

第1小问用KMeans

product_df = pd.read_csv("question_2.csv",sep=';')

product_df.head()

from sklearn.cluster import KMeans

import matplotlib.pyplot as plt

k = 5

kmodel=KMeans(n_clusters=k).fit(product_df)

plt.plot()

plt.scatter(product_df[:, 0], product_df[:, 1], c=kmodel)

plt.title("Cluster method 1")

plt.show()

第2小问用SpectralClustering

from sklearn.cluster import SpectralClustering

k = 5

dbmodel=SpectralClustering(n_clusters=k).fit(product_df)

plt.plot()

plt.scatter(product_df[:, 0], product_df[:, 1], c=dbmodel)

plt.title("Cluster method 2")

plt.show()

注：这个数据集也很奇怪，用;分割后，不止14列，value中出现了;号。。。