确认聚类方式及聚类中心个数,聚类采用kmeans聚类,聚类中心个数为3。
一、数据未做标准化处理
聚类结果
二、数据Z-Score标准化
聚类结果
#Z-Score标准化
#建立StandardScaler对象
zscore = preprocessing.StandardScaler()
#标准化处理
data_zs = zscore.fit_transform(df2)
df3=pd.DataFrame(data_zs)
print(df3)
三、Max-Min标准化
聚类结果
#Max-Min标准化
#建立MinMaxScaler对象
minmax = preprocessing.MinMaxScaler()
#标准化处理
data_minmax = minmax.fit_transform(df2)
df3=pd.DataFrame(data_minmax)
print(df3)
四、结果对比
通过聚类结果生成了新标签,对新标签分别计算IV值用于对比预测能力,结果显示数据没有标准化的结果iv值为0.008最低,而通过MIN-MAX标准化方法处理过的数据IV值提升至0.013,虽然IV值都未达到使用标准,但通过MIX-MAX标准化处理的数据聚类后结果要明显提升。
数据标准化处理可提升模型精度,并加快收敛速度。
IV值