数据标准化模型效果对比

确认聚类方式及聚类中心个数,聚类采用kmeans聚类,聚类中心个数为3。

一、数据未做标准化处理


聚类结果

二、数据Z-Score标准化


聚类结果

#Z-Score标准化

#建立StandardScaler对象

zscore = preprocessing.StandardScaler()

#标准化处理

data_zs = zscore.fit_transform(df2)

df3=pd.DataFrame(data_zs)

print(df3)

三、Max-Min标准化


聚类结果

#Max-Min标准化

#建立MinMaxScaler对象

minmax = preprocessing.MinMaxScaler()

#标准化处理

data_minmax = minmax.fit_transform(df2)

df3=pd.DataFrame(data_minmax)

print(df3)

四、结果对比

通过聚类结果生成了新标签,对新标签分别计算IV值用于对比预测能力,结果显示数据没有标准化的结果iv值为0.008最低,而通过MIN-MAX标准化方法处理过的数据IV值提升至0.013,虽然IV值都未达到使用标准,但通过MIX-MAX标准化处理的数据聚类后结果要明显提升。

数据标准化处理可提升模型精度,并加快收敛速度。

IV值
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。