在应用过程中,由于输入数据变化范围大等原因会在一定程度上增加计算复杂程度、不平衡性以及训练时间等,为避免上述情形,并消除不同量纲等因素的不利影响,首先应对数据值进行归一化处理。
1、传统归一化方法
表示归一化后的值,max(x)和min(x)为取各个样本中的最大值和最小值。使用该方法可将样本值限定于[0,1]范围内。使用该方法可描述各分量在总量中的相对关系,然而也会减小样本间的差异,特别是对不同类别以及数据差异较小的样本影响较大,从而降低判断准确率。
2、[0.1-0.9]归一法
按照这种方法处理数据,使输入数据位于0-1之间的同时,还能够拉开每一个样本之间的数据差异。
3、正态归一化方法
该方法是将数据转化为均值为0,标准差为1的正态分布数据,如下所示:
其中是所有数据的平均数,s表示对应的标准差,其表达式为:
写在最后:文章是在学习过程中做的学习笔记,同时与志同道合者分享,文章内容均经过我自己实验证实可行,如有问题欢迎留言,很高兴一起交流讨论,共同进步!