第1小问 用KMeans
product_df = pd.read_csv("question_2.csv",sep=';')
product_df.head()
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt
k = 5
kmodel=KMeans(n_clusters=k).fit(product_df)
plt.plot()
plt.scatter(product_df[:, 0], product_df[:, 1], c=kmodel)
plt.title("Cluster method 1")
plt.show()
第2小问 用SpectralClustering
from sklearn.cluster import SpectralClustering
k = 5
dbmodel=SpectralClustering(n_clusters=k).fit(product_df)
plt.plot()
plt.scatter(product_df[:, 0], product_df[:, 1], c=dbmodel)
plt.title("Cluster method 2")
plt.show()
注:这个数据集也很奇怪,用;分割后,不止14列,value中出现了;号。。。